
pyvideotrans是一个开源的视频翻译配音工具(开源协议GPL-v3),可将一种语言发音的视频,翻译为另一种语言发音的视频,并嵌入该语言字幕。它利用了先进的语音识别、机器翻译和语音合成技术,实现了视频的自动翻译和配音功能。
比如有一个英文电影,发音是英文,没有英文字幕,也没有中文字幕,使用这个工具处理后,可以转成带中文字幕,并且带有中文配音的电影。单从这么个描述来看是不是就已经感受到这个开源项目的厉害之处了。相信喜欢搜罗电影看的朋友们都是有可能有这个困扰的,看到了自己喜欢的电影或者视频,确听不懂在说什么,那么这个项目就绝对能够帮助到你了!
pyvideotrans-开源的视频翻译配音工具
pyvideotrans的主要功能特点
1.自动视频翻译
集成faster-whisper模型/并支持自定义huggingface模型,同时集成批量语音转字幕、批量字幕翻译、批量配音小工具。
2.多种配音和翻译渠道
配音:edgeTTS|AzureTTS|OpenAiTTS|Elevenlabs|clone-voice|GPT-SoVITS
翻译:Google|ChatGPT|DeepL|Gemini|Mircosoft|百度|腾讯|本地模型
3.可完全离线
翻译渠道替换为本地模型,配音渠道替换为clone-voice,即可实现完全本地离线视频翻译。
4.免费+开源
代码GitHub公开可审查,免费无功能限制,无隐藏收费。开源协议GPL-v3。
pyvideotrans的原理及转换流程
将原始视频先使用 ffmpeg 分离出音频文件和无声的mp4,然后利用 openai-whisper/faster-whisper模型识别出音频中的人声,并保存为srt字幕,接着将srt字幕翻译为目标语言并保存为srt字幕文件,再将翻译结果合成为配音音频文件。接着将配音音频文件、字幕srt文件、原无声mp4合并为一个视频文件,即完成翻译。
pyvideotrans的使用视频教程
https://img.pidoutv.com/wp-content/uploads/2024/07/1720604999-pyvideotrans.mp4
数据统计
相关导航

Vimi是由商汤科技推出的的一...

老照片AI
老照片AI是一个AI老照片视频生成器,通过AI让老照片可以动起来, 制作AI老照片视频。通过输入相关指令和上传图片,用户只需等待 2-3 分钟,即可生成老照片动起来的视频。这项技术不仅可以让老照片焕发新的生命力,还能为用户带来全新的体验和回忆。

Sync Labs
Sync Labs是一款基于AI人工智能的视频音频口型同步处理工具,旨在实现视频语音与画面中人物口型的完美同步。通过领先的AI技术,无需数据集训练,即可实现任意视频与语音的口型同步。

硅语AI
硅语AI是硅基智能所开发的一系列基于人工智能技术的产品和服务。其主要涵盖了AI数字人克隆、AI数字语音合成、AI提词、精准字幕、美颜滤镜等功能,并广泛应用于视频宣讲、直播带货、录口播、录网课、录vlog、提示歌词等场景。通过硅语AI,用户可以创建自己的数字人分身,实现自我表达,并节省大量繁琐和重复性的工作。

Verbalate AI
Verbalate AI是一款AI视频翻译和口型同步的工具。该工具利用人工智能技术,能够无缝地翻译视频中的口语,并将翻译内容与原视频中人物的口唇匹配。此外,它还具有语音克隆和多语言音轨功能,支持多种语言,允许用户创建多语言音轨和视频。

metademolab
通过传入2D人物图片,生成固定动画

老照片AI
老照片AI是一个AI老照片视频生成器,通过AI让老照片可以动起来, 制作AI老照片视频。通过输入相关指令和上传图片,用户只需等待 2-3 分钟,即可生成老照片动起来的视频。这项技术不仅可以让老照片焕发新的生命力,还能为用户带来全新的体验和回忆。

BlurOn
BlurOn是一款先进的AI驱动视频自动马赛克插件,专为自动添加马赛克和模糊效果而设计。它能够自动识别并处理视频中的脸部、头部、全身、车牌等元素,以高达99.7%的精度完成编辑工作。BlurOn广泛应用于电视节目制作、自动驾驶开发和医疗影像等领域,大大减少了手动编辑的工作量,提高了工作效率。
暂无评论...