
LUMI 是一款接入30+AI工具的小说推文视频制作平台,一键生成爆款小说视频! 集改写、配音、图片生成等于一体,告别繁琐流程,轻松产出高质、吸睛的推文视频。专为小说推文从业者与副业创富者设计,让你真正用 AI 高效变现,掘金流量时代!

EasyVoice 是一个开源的文本、小说智能转语音解决方案,旨在帮助用户轻松将文本内容转换为高质量的语音输出。

noScribe 是一款免费开源、完全离线的 AI 语音转写桌面软件,专为采访、学术研究和需要隐私保护的场景设计。它基于 OpenAI Whisper、faster-whisper 和 Pyannote 技术,可将多语言音频或视频精准转换为文字,并提供内置编辑器方便校对。

RealtimeVoiceChat 是一个开源项目,专注于通过语音与人工智能进行实时、自然的对话。用户使用 麦克风输入语音,系统通过浏览器捕获音频,快速转为文字,由大型语言模型(LLM)生成回复,再将文字转为语音输出,整个过程接近实时。

基于 ComfyUI 的高品质音乐音频增强:FlashSR 超分辨率 + Fat Llama 频谱增强(GPU 和 CPU)。

一站式离线 AI 视频字幕生成和翻译软件,从视频下载,音频提取,听写打轴,字幕翻译,视频合成,字幕总结各个环节为翻译者提供便利。本项目基于 Galtransl,采用 GPLv3 许可。

Open-Sora 让所有人都能使用模型、工具和所有细节。

IntraScribe 是面向企业、学校与机关等内网环境的本地优先语音转写与协作平台:支持实时转写、说话人分离、高质量批处理、AI 总结与标题生成。默认提供浏览器 WebRTC 接入与 SSE 实时返回,也支持边缘设备/硬件作为前端,架构解耦、可替换任意采集与传输方案;数据全程留在本地,重视隐私与合规。

Real-Time AI Voice Chat 允许您仅使用语音与大型语言模型 ( LLM ) 聊天,并近乎实时地接收口头响应。将其视为您自己的数字对话伙伴。

Twocast 是真人对话 AI 播客生成器,多语言,多音色。

WhisperLiveKit用于实时、本地语音转文本和说话人分类的 Python 包。FastAPI 服务器和 Web 界面。 直接将语音实时转录到您的浏览器,具有即用型后端+服务器和简单的前端。✨