应用介绍
VoiceTransl是一站式离线AI视频字幕生成和翻译软件,从视频下载,音频提取,听写打轴,字幕翻译,视频合成,字幕总结各个环节为翻译者提供便利。本项目基于Galtransl,采用GPLv3许可。
🎯 特色
支持多种翻译模型,包括在线模型(任意OpenAI兼容接口)和本地模型(Sakura、Galtransl及Ollama、Llamacpp)。
支持AMD/NVIDIA/Intel GPU加速,翻译引擎支持调整显存占用。
支持多种输入格式,包括音频、视频、SRT字幕。
支持多种输出格式,包括SRT字幕、LRC字幕。
支持多种语言,包括日语,英语,韩语,俄语,法语。
支持VAD(语音活动检测),自动识别音频中的语音段落。
支持字典功能,可以自定义翻译字典,替换输入输出。
支持世界书/台本输入,可以自定义翻译参考资料。
支持从YouTube/Bilibili及媒体链接直接下载视频。
支持文件和链接批量处理,自动识别文件类型。
支持音频切分,字幕合并和视频合成。
支持视频总结,将视频内容总结为带时间轴简短的文本。
支持人声分离,将人声和伴奏分离,支持多种模型。

