AI开发编程 开源项目
中文语音大模型

星辰语音大模型被官宣发布并开源

标签:

更适配中文的语音大模型来了——

来自中国电信人工智能研究院,AI领域Fellow大满贯科学家李学龙带队,发布首个能听懂30多种多方言混

说的大模型。

号称最难方言、“魔鬼的语言”的温州话,也不在话下。

还有超自然的语音生成能力。

在2024智算云生态大会上,星辰语音大模型被官宣发布并开源。

要知道,当前语音模型开源开放本来就少,而针对方言更是特定方言特定模型。

开源且支持30种方言,有且只有星辰这么一个。

作为首个完成大语言模型的研发且开源的央企,中国电信现在又在语音模态领域秀起了肌肉。

首个支持30种方言混说语音大模型

那就来说道此次发布的能支持最多方言的语音大模型,核心功能主要体现在识别上——

它打破了单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言。

实际上,它早已获得国际权威赛事的能力认证,以及多个实际场景中落地。

它在国际语音顶会INTERSPEECH2024离散语音单元建模挑战赛上,星辰语音识别大模型斩获了语音识别赛道冠军。

同时在NIST(美国国家标准与技术研究院)举办的低资源粤语电话Babel语音识别任务上,取得业内最优结果。

相关导航

暂无评论

暂无评论...