更适配中文的语音大模型来了——
来自中国电信人工智能研究院,AI领域Fellow大满贯科学家李学龙带队,发布首个能听懂30多种多方言混
说的大模型。
号称最难方言、“魔鬼的语言”的温州话,也不在话下。
还有超自然的语音生成能力。
在2024智算云生态大会上,星辰语音大模型被官宣发布并开源。
要知道,当前语音模型开源开放本来就少,而针对方言更是特定方言特定模型。
开源且支持30种方言,有且只有星辰这么一个。
作为首个完成大语言模型的研发且开源的央企,中国电信现在又在语音模态领域秀起了肌肉。
首个支持30种方言混说语音大模型
那就来说道此次发布的能支持最多方言的语音大模型,核心功能主要体现在识别上——
它打破了单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言。
实际上,它早已获得国际权威赛事的能力认证,以及多个实际场景中落地。
它在国际语音顶会INTERSPEECH2024离散语音单元建模挑战赛上,星辰语音识别大模型斩获了语音识别赛道冠军。
同时在NIST(美国国家标准与技术研究院)举办的低资源粤语电话Babel语音识别任务上,取得业内最优结果。
相关导航
暂无评论...