jiasugongju#
outlook.com

加速工具 >> 视频工具 >> 视频硬字幕提取工具 Video-subtitle-extractor

视频硬字幕提取工具 Video-subtitle-extractor

5月7日发布在视频工具

Video-subtitle-extractor（VSE）是一款能将视频中的硬字幕提取为外挂字幕文件（srt格式）的工具，基于本地实现，不需要调用任何第三方API。

• 提取视频中的关键帧

• 检测视频帧中文本的位置

• 识别视频帧中文本内容

• 过滤非字幕区域的文本

• 去除重复字幕行，生成srt字幕文件或txt文本文件

• 支持批量提取视频字幕

• 支持多语言字幕提取，包括简体中文（中英双语）、繁体中文、英文、日语、韩语等87种语言

• 提供三种提取模式：

快速模式：使用轻量模型，速度快，可能丢失少量字幕或有少量错别字

自动模式：自动判断模型，CPU下使用轻量模型；GPU下使用精准模型，速度较慢，质量更高

精准模式：使用精准模型，GPU下逐帧检测，不丢字幕，几乎无错别字，但速度非常慢

使用说明

1、单文件提取：打开单个视频文件，调整字幕区域，点击运行

2、批量提取：选择多个视频文件，确保每个视频的分辨率、字幕区域保持一致

配置选项

如需生成txt文本，可在backend/config.py中设置GENERATE_TXT=True。

如需去除水印文本或替换特定文本，可编辑backend/configs/typoMap.json文件。例如：

{
  "l'm": "I'm",
  "l just": "I just",
  "Let'sqo": "Let's go",
  "Iife": "life",
  "威筋": "威胁",
  "性感荷官在线发牌": ""
}

视频及程序路径请避免包含中文和空格，否则可能出现未知错误。

安装方式

Windows版本

推荐使用Windows单文件版本v2.0.0（CPU版），双击直接运行，提取码：rl02，若出现误报毒，可使用绿色版，此版本仅供具有Nvidia显卡的用户使用。

源码安装

1、下载安装Miniconda

2、创建并激活conda环境：

conda create -n videoEnv python=3.12
conda activate videoEnv

3、安装依赖文件：

pip install -r requirements.txt

4、安装CUDA和cuDNN（需Nvidia显卡）

CUDA和cuDNN安装指南

Windows 安装CUDA 11.7和对应版本的cuDNN，例如：

python -m pip install paddlepaddle-gpu==2.6.1.post117 -f https://www.paddlepaddle.org.cn/whl/windows/mkl/avx/stable.html

Linux 1、下载并安装CUDA 11.7

2、下载并安装cuDNN 8.4.1

3、安装paddlepaddle-gpu：

python -m pip install paddlepaddle-gpu==2.6.1.post117 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html

运行程序

• 图形界面版本：python gui.py

• 命令行版本：python ./backend/main.py

常见问题

1、运行不正常/cuda及cudnn问题：安装对应版本的cuda与cudnn

2、CondaHTTPError：将.condarc文件放在用户目录下

3、Windows下geos_c.dll错误：卸载Shapely后用conda重新安装

4、7z文件解压错误：升级7-zip到最新版本

你可能感兴趣的

视频硬字幕提取工具 Video-subtitle-extractor

PyVideoTrans 视频翻译配音工具

开源跨平台笔记应用 Notes，支持文件夹嵌套与标签管理、可自定义界面主题

SmartPDF 利用AI快速总结和划分 PDF 文档章节

n8n Autoscaling System：基于Docker的n8n工作流自动化方案

News Agents 在终端运行的多Agent并行新闻聚合与摘要系统

DeerFlow 深度研究框架，将语言模型与 Web 搜索、爬取和 Python 代码执行等专业工具相结合实现高效的自动化研究流程

ZeroSearch强化学习框架，用于提升LLM的搜索能力，降低API成本

AI Manus通用AI Agent框架，支持在沙盒环境中运行工具和操作

ChatWiki知识库AI问答系统

Abogen文本转语音工具，能将文档转为带字幕有声书

CAD-MCP Server 通过自然语言控制CAD软件绘图服务，支持多种绘图和NLP功能

神灯加速器Windows PC版最新下载地址和Windows客户端使用指南

语音生成模型 ChatTTS

Sherpa-ONNX本地运行语音处理工具

cnchar汉字拼音笔画库

视频硬字幕提取工具 Video-subtitle-extractor

ONLYOFFICE Docs 开源在线办公套件

AI Manus通用AI Agent框架，支持在沙盒环境中运行工具和操作

ZeroSearch强化学习框架，用于提升LLM的搜索能力，降低API成本

News Agents 在终端运行的多Agent并行新闻聚合与摘要系统

n8n Autoscaling System：基于Docker的n8n工作流自动化方案

SmartPDF 利用AI快速总结和划分 PDF 文档章节