AI开发编程开源项目

中文语音大模型

星辰语音大模型被官宣发布并开源

标签：开源模型开源项目

更适配中文的语音大模型来了——

来自中国电信人工智能研究院，AI领域Fellow大满贯科学家李学龙带队，发布首个能听懂30多种多方言混

说的大模型。

号称最难方言、“魔鬼的语言”的温州话，也不在话下。

还有超自然的语音生成能力。

在2024智算云生态大会上，星辰语音大模型被官宣发布并开源。

要知道，当前语音模型开源开放本来就少，而针对方言更是特定方言特定模型。

开源且支持30种方言，有且只有星辰这么一个。

作为首个完成大语言模型的研发且开源的央企，中国电信现在又在语音模态领域秀起了肌肉。

首个支持30种方言混说语音大模型

那就来说道此次发布的能支持最多方言的语音大模型，核心功能主要体现在识别上——

它打破了单一模型只能识别特定单一方言的困境，可同时识别理解粤语、上海话、四川话、温州话等30多种方言。

实际上，它早已获得国际权威赛事的能力认证，以及多个实际场景中落地。

它在国际语音顶会INTERSPEECH2024离散语音单元建模挑战赛上，星辰语音识别大模型斩获了语音识别赛道冠军。

同时在NIST（美国国家标准与技术研究院）举办的低资源粤语电话Babel语音识别任务上，取得业内最优结果。

MetaGPT推出的开源版Manus

免费生成高质量图像

硅基开源免费的商用级别克隆数字人模型

阿里通义实验室开源音频生成新模型

开源爆火文本转语音

图片生成高质量的3D模型

暂无评论

暂无评论...