音频生成与处理

CosyVoice

CosyVoice 是阿里开源的一款创新的多语言、情感丰富的语音生成大模型，旨在通过先进的 AI 技术生成自然且富有情感的语音。

CosyVoice 是阿里开源的一款创新的多语言、情感丰富的语音生成大模型，旨在通过先进的 AI 技术生成自然且富有情感的语音。无论是在语音生成的质量，还是在细节控制的精准度上，CosyVoice 都表现卓越，能够应对零样本语音生成、跨语言声音合成以及指令执行等多种任务。仅需要 3~10s 的原始音频，CosyVoice即可生成模拟音色，甚至包括韵律、情感等细节，包括跨语种语音生成。

本文采用 CC BY-NC 4.0 许可协议。商业转载、引用请联系本站获得授权，非商业转载、引用须注明出处。

链接：https://appmark.cn/sites/cosyvoice.html -APPMARK

CosyVoice

相关导航