应用介绍
Speech-AI-Forge 是一个开源的 文本转语音 (TTS) 平台,支持多种先进的语音合成模型(如 ChatTTS、CosyVoice、FishSpeech 等)。它提供 Web 界面和 API 服务,兼容 OpenAI API,用户可以通过自然语言输入快速生成高质量音频,支持音色切换、语气风格和 SSML 控制,适用于语音助手、有声书、播客等场景。
🌟核心特性与功能:
🗣 多模型支持:兼容 ChatTTS、CosyVoice、FishSpeech 等多种 TTS 模型
🔑 兼容 OpenAI API:可通过 API 调用生成语音,支持与其他 AI 应用集成
🎙 音色定制:内置多种音色,支持上传自定义音色或参考音频推理
📖 长文本处理:自动分割超长文本,支持批量推理,提高效率
🎧 语音增强:集成音频增强模型,提升输出音质
📝 SSML 支持:支持语音合成标记语言,灵活控制停顿、语气、语速
🌐 WebUI + API 双支持:既能通过 Gradio Web 界面操作,也能通过 API 集成到其他应用
🚀 多场景应用:适合语音助手、有声书制作、播客生成、教育培训等

