Seed-Music 是字节跳动推出的 AI 音乐生成大模型,将用户录制的 10 秒音频转化为完整的音乐作品。Seed-Music 将语言模型与扩散模型的优势相结合,并融入作曲工作流之中,适用于小白、专业人士的不同音乐创作场景。
本文采用 CC BY-NC 4.0 许可协议。商业转载、引用请联系本站获得授权,非商业转载、引用须注明出处。
链接:https://appmark.cn/sites/seed-music.html -APPMARK
Seed-Music 是字节跳动推出的 AI 音乐生成大模型,将用户录制的 10 秒音频转化为完整的音乐作品。Seed-Music 将语言模型与扩散模型的优势相结合,并融入作曲工作流之中,适用于小白、专业人士的不同音乐创作场景。
本文采用 CC BY-NC 4.0 许可协议。商业转载、引用请联系本站获得授权,非商业转载、引用须注明出处。
链接:https://appmark.cn/sites/seed-music.html -APPMARK
FastSpeech2 是微软提出的一个快速、高质量的端到端文本转语音(TTS)模型,是 FastSpeech 的改进版本,特别适合于实时语音播报、智能客服等场景。