jiasugongju#
outlook.com

加速工具 >> 视频工具 >> PyVideoTrans 视频翻译配音工具

PyVideoTrans 视频翻译配音工具

5月6日发布在视频工具

PyVideoTrans 是一个强大的视频翻译配音工具，能将一种语言的视频转换为指定语言的视频，自动生成和添加相应语言的字幕与配音。

语音识别

PyVideoTrans 支持多种语音识别模型，包括 faster-whisper、openai-whisper、Google Speech 和阿里中文语音识别模型（zh_recogn）。

文字翻译

PyVideoTrans 支持微软翻译、Google 翻译、百度翻译、腾讯翻译、ChatGPT、Azure AI、Gemini、DeepL、DeepLX 和离线翻译 OTT 等多种翻译服务。

文字合成语音

PyVideoTrans 支持 Microsoft Edge TTS、Google TTS、Azure AI TTS、Openai TTS、Elevenlabs TTS、自定义 TTS 服务器 API、GPT-SoVITS、clone-voice 和 ChatTTS-ui 等多种语音合成方式。

其他功能

• 保留背景伴奏音乐（基于 uvr5）

• 支持多种语言：中文简繁、英语、韩语、日语、俄语、法语、德语、意大利语、西班牙语、葡萄牙语、越南语、泰国语、阿拉伯语、土耳其语、匈牙利语、印度语、乌克兰语、哈萨克语、印尼语、马来语、捷克语

• 翻译视频并配音：将视频中的声音翻译为另一种语言的配音，并嵌入该语言字幕

• 音频或视频转为字幕：将音频、视频文件中的人类说话声识别为文字并导出为 srt 字幕文件

• 批量字幕创建配音：根据本地已有的 srt 字幕文件创建配音，支持单个或批量字幕

• 批量子幕翻译：将一个或多个 srt 字幕文件翻译为其他语言的字幕文件

• 音频、视频、字幕合并：音频文件、视频文件、字幕文件合并为一个视频文件

• 从视频中分离出音频：从视频中分离为音频文件和无声视频

• 下载油管视频

使用方式

预打包版本（仅 win10/win11 可用，MacOS/Linux 系统使用源码部署）

1、使用 pyinstaller 打包，未做免杀和签名，杀软可能报毒，请加入信任名单或使用源码部署

2、解压到英文路径下，路径中不要含有空格，解压后双击 sp.exe（若遇到权限问题可右键使用管理员权限打开）

3、注意：必须解压后使用，不可直接压缩包内双击使用，也不可解压后移动 sp.exe 文件到其他位置

MacOS 源码部署

1、打开终端窗口，分别执行如下命令

◦ 执行前确保已安装 Homebrew，如果你没有安装 Homebrew，那么需要先安装

◦ 执行命令安装 Homebrew: /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

◦ 安装完成后，执行: eval $(brew --config) brew install libsndfilebrew install ffmpegbrew install gitbrew install [email protected]

◦ 继续执行 export PATH="/usr/local/opt/[email protected]/bin:$PATH"source ~/.bash_profile source ~/.zshrc

◦ 创建不含空格和中文的文件夹，在终端中进入该文件夹

◦ 终端中执行命令 git clone https://github.com/jianchang512/pyvideotrans

◦ 执行命令 cd pyvideotrans

◦ 继续执行 python -m venv venv

◦ 继续执行命令 source ./venv/bin/activate，执行完毕查看确认终端命令提示符已变成已 (venv) 开头，以下命令必须确定终端提示符是以 (venv) 开头

◦ 执行 pip install -r requirements.txt --no-deps，如果提示失败，执行如下 2 条命令切换 pip 镜像到阿里镜像

▪ pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/pip config set install.trusted-host mirrors.aliyun.com

◦ 然后重新执行，如果已切换到阿里镜像源，仍提示失败，请尝试执行 pip install -r requirements.txt --ignore-installed --no-deps

◦ python sp.py 打开软件界面

Linux 源码部署

CentOS/RHEL 系 1、安装 python3.10

◦ sudo yum update

◦ sudo yum groupinstall "Development Tools"

◦ sudo yum install openssl-devel bzip2-devel libffi-devel

◦ cd /tmp

◦ wget https://www.python.org/ftp/python/3.10.4/Python-3.10.4.tgz

◦ tar xzf Python-3.10.4.tgz

◦ cd Python-3.10.4

◦ ./configure --enable-optimizations

◦ sudo make && sudo make install

◦ sudo alternatives — install /usr/bin/python3 python3 /usr/local/bin/python3.10

◦ sudo yum install -y ffmpeg

Ubuntu/Debian 系

1、安装 python3.10

◦ apt update && apt upgrade -y

◦ apt install software-properties-common -y

◦ add-apt-repository ppa:deadsnakes/ppa

◦ apt update

◦ sudo apt-get install libxcb-cursor0

◦ apt install python3.10

◦ curl -sS https://bootstrap.pypa.io/get-pip.py | python3.10

◦ pip 23.2.1 from /usr/local/lib/python3.10/site-packages/pip (python 3.10)

◦ sudo update-alternatives --install /usr/bin/python python /usr/local/bin/python3.10

◦ sudo update-alternatives --config python

◦ apt-get install ffmpeg

2、打开任意一个终端，执行 python3 -V，如果显示 “3.10.4”，说明安装成功，否则失败

3、创建个不含空格和中文的文件夹，从终端打开该文件夹

4、终端中执行命令 git clone https://github.com/jianchang512/pyvideotrans

5、继续执行命令 cd pyvideotrans

6、继续执行 python -m venv venv

7、继续执行命令 source ./venv/bin/activate，执行后请查看确认终端命令提示符已变成已 (venv) 开头，以下命令必须确定终端提示符是以 (venv) 开头

8、执行 pip install -r requirements.txt --no-deps，如果提示失败，执行如下 2 条命令切换 pip 镜像到阿里镜像

◦ pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/pip config set install.trusted-host mirrors.aliyun.com

◦ 然后重新执行，如果已切换到阿里镜像源，仍提示失败，请尝试执行 pip install -r requirements.txt --ignore-installed --no-deps

9、如果要使用 CUDA 加速，分别执行

◦ pip uninstall -y torch torchaudio

◦ pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu118

◦ pip install nvidia-cublas-cu11 nvidia-cudnn-cu11

10、如果要启用 cuda 加速，必须有英伟达显卡，并且配置好了 CUDA11.8+环境，请自行搜索 "Linux CUDA 安装"

11、解压 ffmpeg.zip 到当前源码目录下，提示覆盖则覆盖，解压后确保源码下的 ffmepg 文件夹内能看到 ffmpeg.exe ffprobe.exe ytwin32.exe

12、python sp.py 打开软件界面

Windows 10/11 源码部署

1、打开 https://www.python.org/downloads/ 下载 windows3.10，下载后双击，一路 next，注意要选中 “Add to PATH”

2、打开 https://github.com/git-for-windows/git/releases/download/v2.45.0.windows.1/Git-2.45.0-64-bit.exe，下载 git，下载后双击一路下一步

3、找个不含空格和中文的文件夹，地址栏中输入 cmd 回车，打开终端，以下命令均在该终端中执行

4、执行命令 git clone https://github.com/jianchang512/pyvideotrans

5、继续执行命令 cd pyvideotrans

6、继续执行 python -m venv venv

7、继续执行命令 .\venv\scripts\activate，执行后请查看确认命令行开头已变成了 (venv)，否则说明出错

8、执行 pip install -r requirements.txt --no-deps，如果提示失败，执行如下 2 条命令切换 pip 镜像到阿里镜像

◦ pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/pip config set install.trusted-host mirrors.aliyun.com

◦ 然后重新执行，如果已切换到阿里镜像源，仍提示失败，请尝试执行 pip install -r requirements.txt --ignore-installed --no-deps

9、如果要使用 CUDA 加速，分别执行

◦ pip uninstall -y torch torchaudio

◦ pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu118

10、windows 如果要启用 cuda 加速，必须有英伟达显卡，并且配置好了 CUDA11.8+环境，具体安装见 CUDA 加速支持

11、解压 ffmpeg.zip 到当前源码目录下，提示覆盖则覆盖，解压后确保源码下的 ffmepg 文件夹内能看到 ffmpeg.exe ffprobe.exe ytwin32.exe

12、python sp.py 打开软件界面

源码部署问题说明

默认使用 ctranslate2 的 4.x 版本，仅支持 CUDA12.x 版本，如果你的 cuda 低于 12，并且无法升级 cuda 到 12.x，请执行命令卸载 ctranslate2 然后重新安装

• pip uninstall -y ctranslate2

• pip install ctranslate2==3.24.0

可能会遇到 xx module not found 之类错误，请打开 requirements.txt，搜索该 xx 模块，然后将 xx 后的 ==及等会后的版本号去掉

你可能感兴趣的

视频硬字幕提取工具 Video-subtitle-extractor

PyVideoTrans 视频翻译配音工具

AI Manus通用AI Agent框架，支持在沙盒环境中运行工具和操作

ChatWiki知识库AI问答系统

Abogen文本转语音工具，能将文档转为带字幕有声书

CAD-MCP Server 通过自然语言控制CAD软件绘图服务，支持多种绘图和NLP功能

MiMo 小米推理模型通过预训练和后训练策略提升语言模型的推理潜力

MCP SuperAssistant：Chrome扩展，将MCP工具集成到ChatGPT等AI平台

SuperCoder：在终端内运行的编码助手

Meeting Prep Agent利用Tavily搜索和MCP，实时分析会议信息

DeepWiki为GitHub等代码仓库自动创建精美、交互式Wiki文档，可生成可视化图表。

DBeaver 通用数据库SQL客户端工具

如何用Origin2024做立体感十足的3D并排条状图？

IOPaint 图像修复扩展工具

手游《龙珠战力之巅》攻略

PyVideoTrans 视频翻译配音工具

cnchar汉字拼音笔画库

Perspective 用于大型数据和流式数据的数据可视化和分析工具

LookScanned 将 PDF 转换成扫描文件的工具

ONLYOFFICE Docs 开源在线办公套件

DeepWiki为GitHub等代码仓库自动创建精美、交互式Wiki文档，可生成可视化图表。

Meeting Prep Agent利用Tavily搜索和MCP，实时分析会议信息

SuperCoder：在终端内运行的编码助手

ChatWiki知识库AI问答系统