© 加速工具
jiasugongju#
outlook.com

Video-subtitle-extractor(VSE)是一款能将视频中的硬字幕提取为外挂字幕文件(srt格式)的工具,基于本地实现,不需要调用任何第三方API。

• 提取视频中的关键帧

• 检测视频帧中文本的位置

• 识别视频帧中文本内容

• 过滤非字幕区域的文本

• 去除重复字幕行,生成srt字幕文件或txt文本文件

• 支持批量提取视频字幕

• 支持多语言字幕提取,包括简体中文(中英双语)、繁体中文、英文、日语、韩语等87种语言

• 提供三种提取模式:

快速模式:使用轻量模型,速度快,可能丢失少量字幕或有少量错别字

自动模式:自动判断模型,CPU下使用轻量模型;GPU下使用精准模型,速度较慢,质量更高

精准模式:使用精准模型,GPU下逐帧检测,不丢字幕,几乎无错别字,但速度非常慢

使用说明

1、单文件提取:打开单个视频文件,调整字幕区域,点击运行

2、批量提取:选择多个视频文件,确保每个视频的分辨率、字幕区域保持一致

配置选项

如需生成txt文本,可在backend/config.py中设置GENERATE_TXT=True。

如需去除水印文本或替换特定文本,可编辑backend/configs/typoMap.json文件。例如:

{
  "l'm": "I'm",
  "l just": "I just",
  "Let'sqo": "Let's go",
  "Iife": "life",
  "威筋": "威胁",
  "性感荷官在线发牌": ""
}

视频及程序路径请避免包含中文和空格,否则可能出现未知错误。

安装方式

Windows版本

推荐使用Windows单文件版本v2.0.0(CPU版),双击直接运行,提取码:rl02,若出现误报毒,可使用绿色版,此版本仅供具有Nvidia显卡的用户使用。

源码安装

1、下载安装Miniconda

2、创建并激活conda环境:

conda create -n videoEnv python=3.12
conda activate videoEnv

3、安装依赖文件:

pip install -r requirements.txt

4、安装CUDA和cuDNN(需Nvidia显卡)

CUDA和cuDNN安装指南

Windows 安装CUDA 11.7和对应版本的cuDNN,例如:

python -m pip install paddlepaddle-gpu==2.6.1.post117 -f https://www.paddlepaddle.org.cn/whl/windows/mkl/avx/stable.html

Linux 1、下载并安装CUDA 11.7

2、下载并安装cuDNN 8.4.1

3、安装paddlepaddle-gpu:

python -m pip install paddlepaddle-gpu==2.6.1.post117 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html

运行程序

• 图形界面版本:python gui.py

• 命令行版本:python ./backend/main.py

常见问题

1、运行不正常/cuda及cudnn问题:安装对应版本的cuda与cudnn

2、CondaHTTPError:将.condarc文件放在用户目录下

3、Windows下geos_c.dll错误:卸载Shapely后用conda重新安装

4、7z文件解压错误:升级7-zip到最新版本