APPMARK APPMARK
  • AI模型平台
    • 通用大语言模型
    • 视觉与图像生成
    • 视频生成
    • 音频生成与处理
    • 专用模型
    • 模型接入平台
    • 一站式管理与应用
    • 训练与微调
  • 智能体应用
  • AI知识库
  • AI提示词
  • AI行业应用
  • AI写作
  • AI办公
  • AI聊天
  • AI图像
  • AI视频
  • AI音频
  • AI设计
  • AI翻译
  • AI搜索
  • AI编程
  • AI开发平台
  • AI法律助手
  • AI学习资源
    • 博客
    • 友情链接
    • 提交网址
    • 隐私政策
  • APPMARK
PaddleSpeech
AI音频 音频生成与处理

PaddleSpeech

PaddleSpeech 是百度飞桨推出的一款开源语音工具包,旨在提供一站式的语音处理解决方案。

链接直达 手机查看
快点收藏起来

PaddleSpeech 是百度飞桨推出的一款开源语音工具包,旨在提供一站式的语音处理解决方案。

本文采用 CC BY-NC 4.0 许可协议。商业转载、引用请联系本站获得授权,非商业转载、引用须注明出处。

链接:https://appmark.cn/sites/paddlespeech.html -APPMARK

相关导航

SpeechT5

SpeechT5 是一个基于 Transformer 架构的语音技术平台,提供语音合成、识别、情感分析等多种功能。

GCP TTS

Google Cloud Text-to-Speech API 使开发人员能够借助超过 100 种语音合成自然语音,支持多种语言和变体。

Mubert

Mubert 是一个生成个性化背景音乐(BGM)的工具,适用于视频、直播等场景。

Riffusion

Riffusion 是一个基于稳定扩散技术的实时音乐和音频生成库。 它通过先进的扩散管道,实现了提示插值与图像条件化的结合,能够将 spectrogram 图像与音频片段进行转换。

FastSpeech2

FastSpeech2 是微软提出的一个快速、高质量的端到端文本转语音(TTS)模型,是 FastSpeech 的改进版本,特别适合于实时语音播报、智能客服等场景。

Udio

Udio 是由前谷歌 DeepMind 研究员创建的创新型 AI 音乐生成器。

APPMARK
APPMARK 是快速找到最新 AI(Artificial Intelligence, 人工智能)应用的一站式导航平台,我们按照模型平台、提示词、写作、办公、对话聊天、图像、视频、设计、语音、编程、开发平台、法律助手、学习资源等进行分类导航和索引,并保持更新,最短时间内找到需要的AI应用。
  • 博客文章 !
  • 隐私政策 !
  • 收藏本站 !
您可以通过以下方式联系我们
Copyright ©2024-2025 APPMARK. All Rights Reserved. 京ICP备2023037043号-2 京公网安备11010102007072号