视频硬字幕提取器
随着网络的发展,传统视频字幕的加载形式也出现了不小变化,在视频传播初期往往以外挂字幕为主,但后续为了实现更高的兼容性和传播能力,逐渐发展出了软字幕、硬字幕两种全新的形式。
其中外挂字幕的灵活性使其成为初期视频字幕的主流方式。在这些加载形式中外挂字幕灵活性最高,在用户播放视频时,播放器往往会在视频原目录下查找srt、vtt、ass等字幕文件,匹配完成后与视频进行关联,最终呈现出带有字幕的视频画面。然而,外挂字幕所拥有较高的灵活性来源与字幕文件。虽然用户可以自行修改字幕文件来做到字幕翻译、矫正等工作,但由于在视频分发过程中需要将视频文件和字幕文件一起打包发布,这也使得该字幕挂载方式在传播方面受到了一定限制。为改善该问题,软字幕的出现让分发视频可以通过单文件的形式进行发布,其原理为在视频中的视频流、音频流两项基础流外增加一个字幕流,在该流中加入字幕信息即可达到显示视频字幕的效果。
然而在早期的视频播放设备中,由于字幕流同样需要解码器方可工作,这也使得部分不支持字幕解码器的设备没有办法显示来自软字幕的字幕信息。如果将字幕以图像的形式直接“贴”在视频上,是不是就可以共用一套解码器了吗?当然可以,硬字幕就是将字幕转换为图像然后与视频进行逐帧融合,它可以像水印一样一直挂在所显示的画面上,无需额外的字幕流解码器即可轻松播放。但也正是因为进行了图像融合,我们在丢失原始素材文件后,若想对生成后的硬字幕个人作品进行翻译、矫正也增加了许多难度,一个视频硬字幕提取器则能很好的解决该类情况。Video Subtitle Extractor(VSE)就是这样一款可以提取来自视频硬字幕的开源项目,其底层借助拥有强大的文本识别能力的PaddleOCR,使用者只需对硬字幕出现的区域进行框选即可批量进行识别所出现的字幕信息。也正是因为PaddleOCR,该工具在GPU模式下可获得相较CPU模式近10倍的性能提升。除此之外,项目作者还提供了多种用于质量和速度优化的常见策略实现,在字幕提取前会预先搜索视频中关键帧情况,同时还会联合前后帧关系过滤出与字幕无关的文字信息,最后还非常贴心的加入了srt格式的字幕文件生成能力,体验极佳!● ● ●本文提供WIN整合版本解压即可使用(集成N卡环境)● ● ●Video Subtitle Extractor以下简称VSE,是一个利用强大的文本识别能力的PaddleOCR,对硬字幕区域框选,进而批量识别字幕信息的软件。
功能特色:
- 采用本地进行OCR识别,无需设置调用任何API,不需要接入百度、阿里等在线OCR服务即可本地完成文本识别
- 支持GPU加速,GPU加速后可以获得更高的准确率与更快的提取速度
- (CLI版本) 无需用户手动设置字幕区域,项目通过文本检测模型自动检测字幕区域
- (GUI版本) 图形化界面
- 提取视频中的关键帧
- 检测视频帧中文本的所在位置
- 识别视频帧中文本的内容
- 过滤非字幕区域的文本,去除水印(台标)文本
- 去除重复字幕行,生成srt字幕文件
- 支持视频字幕批量提取(打开文件的时候选择多个视频)
- 多语言:支持中文/英文、日语、韩语、阿拉伯语、繁体中文、法语、德语、俄语、西班牙语、葡萄牙语、意大利语字幕的提取
- 多模式:
- 快速 – 快速提取字幕但可能丢字幕(推荐)
- 精准 – 不丢字幕但速度较慢
软件图标
今天分享的是GPU版本,比CPU强10倍性能,虽然文件略大,不过效果更好
后台领取关键词后,解压,安装。
注意安装的目录和路径不能有任何中文和空格,否则会莫名报错。
解压后,右键以管理员身份运行Vse.exe,首次需要安装conda环境,等待安装即可
安装完成后,等待软件出现窗口字幕提取器就可以使用,同时后面的命令行窗口(黑乎乎的那个)可以最小化,但不能关闭,需在后台运行。
选择你要提取的视频文件,注意这个文件名和文件路径也不能有中文(有的话自己重命名),调整字幕区域,再点击运行
让视频播放完,字幕就提取完成,甚至生成srt格式
打开字幕文件就可以看到详细内容
一图看清软件流程
另外,软件支持批量提取也去除重复,支持的语言多达数十种,不仅中英法!
有这块需求的朋友可以自行安排~
扫码免费下载