
01 AI语音识别赋能全行业智能交互:
方言是本土交互的情感纽带,更是技术落地的核心场景。
近日,天聪智能与厦门大学智能语音实验室联合研发的闽南语语音识别(ASR)与语音合成(TTS)技术完成全方位升级,重点突破闽南语适配瓶颈,实现从“能听懂闽南语”到“听得准方言俚语、说得地道够味”的跨越式突破,为闽南地区各行业智能交互注入本土新动能。
此次升级以闽南语识别为核心突破口,依托数千小时闽南语原生语料及多场景音频数据训练,在方言准确性、本土自然度实现质的飞跃,打造更贴合闽南地区需求的语音解决方案。
02 闽南语识别升级:准确率大幅提升,同时支持普通话
历经近五年的数据积累和算法改进,新版ASR模型全面升级,字识别准确率大幅提升,且同时支持普通话识别。与其它商业系统不同的是,该系统识别结果全部用普通话字显示,对用户更加友好。
在优化的过程中,经过三个阶段的数据搜集和标注精校,在内部数据集测试中,字识别准确率达到由80%突破至87%。我们基于数千小时闽南语原生语料训练,覆盖泉州、厦门、漳州、台湾等主流口音及变体,覆盖数十个闽南语地区的数据,目前以厦门、漳州、泉州为主,识别更为准确。
03 语音合成升级:支持更多本地口音
核心能力升级:重点强化方言表达质感,闽南语合成突破“机器人地瓜腔”瓶颈,通过参数高效微调技术还原地道语调与情感张力,可自然呈现亲切对话感与地域语气特色。同时支持闽南语多音色定制,覆盖新闻播报、民生服务等场景需求,搭配语音转语音优化,实现普通话与闽南语实时顺滑转换,让人机交互更贴近本土沟通习惯。
支持厦门、泉州、漳州本地口音,根据随机测试反馈结果,以100分为准,字词准确度得分在80-90分之间,多随机场景的字词句得分在70-80分之间,发音准确度、自然度得分在75-80分之间。同时可以为企业用户提供定制化服务,发音人按要求录制一定量的闽南语或普通话音频便可进行音色定制。不仅可以真实还原个人音色,让声音更具特色,实现有温度、有感情、零距离感的真实分享。
04 全场景落地:赋能行业数字化转型
天聪智能升级后的技术已形成成熟方言解决方案,能够针对不同行业和领域的需求,调整不同的应用配置和功能配置,因此可广泛应用在智能手机、平板电脑、智能电视、私人车载导航、公共交通系统、电视新闻广播、智能家居等移动互联网行业和领域。
在闽南语场景规模化落地:2020年,闽南语识别和合成上线知名学习软件—“说咱闽南话”APP,受到用户的普遍欢迎,至今已累计被使用超550万次。2023年,应用于女足世界杯闽南语解说,识别准确率达90%以上。2025年,应用于漳州通的闽南语识别、海峡都市报AI闽南语播报。
【天聪智能语音平台体验】
我们已开放网页版测试,并推出“闽南话识别”和“AI语音合成”小程序,欢迎企业、个人用户体验,详情可访问:https://mp.weixin.qq.com/s/VQMO3HougpvOYQ5GsiwzqQ