Speech-AI-Forge

Web 应用语音视频
立即访问
应用介绍

Speech-AI-Forge 是一个开源的 文本转语音 (TTS) 平台,支持多种先进的语音合成模型(如 ChatTTS、CosyVoice、FishSpeech 等)。它提供 Web 界面和 API 服务,兼容 OpenAI API,用户可以通过自然语言输入快速生成高质量音频,支持音色切换、语气风格和 SSML 控制,适用于语音助手、有声书、播客等场景。


🌟核心特性与功能:

🗣 多模型支持:兼容 ChatTTS、CosyVoice、FishSpeech 等多种 TTS 模型

🔑 兼容 OpenAI API:可通过 API 调用生成语音,支持与其他 AI 应用集成

🎙 音色定制:内置多种音色,支持上传自定义音色或参考音频推理

📖 长文本处理:自动分割超长文本,支持批量推理,提高效率

🎧 语音增强:集成音频增强模型,提升输出音质

📝 SSML 支持:支持语音合成标记语言,灵活控制停顿、语气、语速

🌐 WebUI + API 双支持:既能通过 Gradio Web 界面操作,也能通过 API 集成到其他应用

🚀 多场景应用:适合语音助手、有声书制作、播客生成、教育培训等

feedback