Video-subtitle-extractor(VSE)是一款能将视频中的硬字幕提取为外挂字幕文件(srt格式)的工具,基于本地实现,不需要调用任何第三方API。
• 提取视频中的关键帧
• 检测视频帧中文本的位置
• 识别视频帧中文本内容
• 过滤非字幕区域的文本
• 去除重复字幕行,生成srt字幕文件或txt文本文件
• 支持批量提取视频字幕
• 支持多语言字幕提取,包括简体中文(中英双语)、繁体中文、英文、日语、韩语等87种语言
• 提供三种提取模式:
快速模式:使用轻量模型,速度快,可能丢失少量字幕或有少量错别字
自动模式:自动判断模型,CPU下使用轻量模型;GPU下使用精准模型,速度较慢,质量更高
精准模式:使用精准模型,GPU下逐帧检测,不丢字幕,几乎无错别字,但速度非常慢
使用说明
1、单文件提取:打开单个视频文件,调整字幕区域,点击运行
2、批量提取:选择多个视频文件,确保每个视频的分辨率、字幕区域保持一致
配置选项
如需生成txt文本,可在backend/config.py中设置GENERATE_TXT=True。
如需去除水印文本或替换特定文本,可编辑backend/configs/typoMap.json文件。例如:
{
"l'm": "I'm",
"l just": "I just",
"Let'sqo": "Let's go",
"Iife": "life",
"威筋": "威胁",
"性感荷官在线发牌": ""
}
视频及程序路径请避免包含中文和空格,否则可能出现未知错误。
安装方式
Windows版本
推荐使用Windows单文件版本v2.0.0(CPU版),双击直接运行,提取码:rl02,若出现误报毒,可使用绿色版,此版本仅供具有Nvidia显卡的用户使用。
源码安装
1、下载安装Miniconda
2、创建并激活conda环境:
conda create -n videoEnv python=3.12
conda activate videoEnv
3、安装依赖文件:
pip install -r requirements.txt
4、安装CUDA和cuDNN(需Nvidia显卡)
CUDA和cuDNN安装指南
Windows 安装CUDA 11.7和对应版本的cuDNN,例如:
python -m pip install paddlepaddle-gpu==2.6.1.post117 -f https://www.paddlepaddle.org.cn/whl/windows/mkl/avx/stable.html
Linux 1、下载并安装CUDA 11.7
2、下载并安装cuDNN 8.4.1
3、安装paddlepaddle-gpu:
python -m pip install paddlepaddle-gpu==2.6.1.post117 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html
运行程序
• 图形界面版本:python gui.py
• 命令行版本:python ./backend/main.py
常见问题
1、运行不正常/cuda及cudnn问题:安装对应版本的cuda与cudnn
2、CondaHTTPError:将.condarc文件放在用户目录下
3、Windows下geos_c.dll错误:卸载Shapely后用conda重新安装
4、7z文件解压错误:升级7-zip到最新版本