
这是一个视频翻译配音工具,可将一种语言的视频翻译为指定语言的视频,自动生成和添加该语言的字幕和配音。并支持API调用
语音识别支持 faster-whisper和openai-whisper本地离线模型 及 OpenAI SpeechToText API GoogleSpeech 阿里中文语音识别模型和豆包模型,并支持自定义语音识别api.
文字翻译支持 微软翻译|Google翻译|百度翻译|腾讯翻译|ChatGPT|AzureAI|Gemini|DeepL|DeepLX|字节火山|离线翻译OTT
文字合成语音支持 Microsoft Edge tts Google tts Azure AI TTS Openai TTS Elevenlabs TTS 自定义TTS服务器api GPT-SoVITS clone-voice ChatTTS-ui Fish TTS CosyVoice
允许保留背景伴奏音乐等(基于uvr5)
支持的语言:中文简繁、英语、韩语、日语、俄语、法语、德语、意大利语、西班牙语、葡萄牙语、越南语、泰国语、阿拉伯语、土耳其语、匈牙利语、印度语、乌克兰语、哈萨克语、印尼语、马来语、捷克语、波兰
- 视频翻译配音一体化:自动将原视频语音翻译为指定语言(支持 20 + 语种),同步生成配音并嵌入字幕,保留背景音(基于 uvr5 技术)。
- 高精度字幕识别:集成 faster-whisper、OpenAI-Whisper 等 4 大语音识别模型,教程 / 影视字幕识别率超 95%,适配中、英、日、韩等多语种。
- 全场景文字处理:支持微软 / Google / 百度等 10 + 翻译引擎(含免费 ChatGPT API),搭配 11 种语音合成工具(Elevenlabs/TTS 等),可克隆音色。
| 场景类型 |
具体应用示例 |
| 外语影视汉化 |
无字幕日漫 / 美剧一键生成中文字幕,同步添加中文配音(支持保留原片 BGM)。 |
| 教程字幕制作 |
自动识别英文教程语音,翻译为中文并嵌入字幕,效率提升 10 倍(亲测教程场景)。 |
| 多语言内容生产 |
批量将中文视频转为英 / 日 / 韩语版本,适配跨境电商、海外自媒体运营。 |
| 音频视频处理 |
分离视频音频、合并字幕与素材、油管视频下载(需科学上网),一站式解决后期需求。 |
- 0 门槛开箱即用:已打包全模型,解压直接运行,无需额外下载插件或配置环境。
- 免费资源支持:内置免费 ChatGPT 翻译接口(apiskey.top 赞助),非商用场景零成本。
- 多语言全兼容:支持 20 + 语种互译(含中文简繁、阿拉伯语、越南语等小语种),覆盖 99% 常用语言。
- 视频翻译配音:语音识别→翻译→配音→字幕嵌入全流程自动化。
- 字幕处理:
- 音频 / 视频转 SRT 字幕(支持批量);
- 字幕翻译(多语言互转)、字幕配音生成。
- 音视频编辑:
- 音频分离、素材合并、背景音保留;
- 油管视频下载(需科学上网)。
- 技术支持:
- 语音识别:faster-whisper、OpenAI-Whisper、Google Speech、阿里中文识别;
- 文字翻译:10 + 在线引擎 + 离线 OTT 翻译;
- 语音合成:11 种 TTS 工具(含音色克隆)。