硬字幕是指合并到视频画面里的字幕,它是画面的一部分,而非外挂的字幕文件。
我有一些日语视频没有字幕,我在南+论坛求助,有人发了其中两个视频的硬字幕版本。但是我觉得这俩硬字幕视频经过了重新编码,画质不如原版,所以我想把字幕提取出来,配合原版视频使用。
我找到了一个软件“硬字幕提取器”,这是一个用 Python 结合深度学习框架做的识别字幕的软件,它可以提取硬字幕文字并自动保存为 srt 字幕文件,并且支持多种语言。
我试了下使用起来很简单,而且效果很棒,没有错别字,时间也吻合。
GitHub 主页:https://github.com/YaoFANGUK/video-subtitle-extractor
下载安装包:https://github.com/YaoFANGUK/video-subtitle-extractor/releases
对于 Windows 用户,建议选择 CPU 版本或者 GPU 版本。
由于我只有两个视频需要处理,为了省事我下载了 CPU 版本。
因为 GPU 版本体积更大,而且可能需要配置(根据说明,或许可以尝试解压后直接用,如果出问题了再安装依赖)。
下载后解压,注意:软件存放路径和视频路径里都不能含有中文、空格。
然后运行 vse.exe,打开软件界面。
界面很简单,先打开要处理的视频,在视频下方可以拖动进度条预览。
如有必要,可以使用右下角的滑块来调整字幕识别区域的大小和位置。
然后点击底部的设置按钮,可以设置识别语言以及识别模式。
最后点击运行,等待执行完毕就可以了,它会在视频文件夹里保存一个同名的 srt 字幕文件。
硬字幕视频:
原视频使用提取后的字幕文件:
字体有点大,不过这和字幕文件无关,因为 srt 字幕并没有规定字体样式,现在的字体样式是播放器的默认设置。
我使用的是 Potplayer,可以在字幕设置里调整样式:
我减小了字号并把字体设置为幼圆,取消加粗,看起来好多了:
由于我下载的是 CPU 版本,所以处理速度会比较慢,而且 CPU 使用率在大部分时间都是全程拉满的。
我心疼的不是 CPU 的占用率,而是温度……笔记本的散热太拉胯了,全程 90 度就跟烤鸡差不多。
对于这个 2000x1500 分辨率,30 FPS,时长 646 秒,文本里不多的视频,我选择精准识别模式,处理起来花费了 1681 秒。
如果你有比较多的视频需要处理,使用 GPU 版应该可以大幅节省时间(根据说明,还可以提高识别的准确率)。
提取视频内嵌字幕的软件(硬字幕提取器)
-
Google Chrome 103Windows -
Google Chrome 103Windows 还有一个
https://www.zhihu.com/people/huang-yao-shi-91-46/posts
https://bbs.acgrip.com/thread-7385-1-1.html
这个也不错
我就是发现了这个之后开始制作 SURVIVE MORE 和 SURVIVE 的PPT视频字幕
而且发在了南+
而且现在还有漫画字幕提取器
https://www.basiccat.org/zh/imagetrans/
https://github.com/dmMaze/BallonsTranslator
我也制作了一些漫画
发在了E站
https://exhentai.org/?f_search=uploader%3Allflzy+uploader%3A%E6%B7%AB%E4%B9%A6%E9%A6%86+uploader%3AL%E6%B7%AB%E4%B9%A6%E9%A6%86L
现在的工具很方便小白自食其力了 外加最近的GPT加持 更是如虎添翼
说道开箱即用 还是差一点 每天群里都能看到 有人捣鼓 然后问怎么运行不了
解压就用还是黄老邪的更胜一筹对小白来说配置环境和申请API 还是简单 API随便注册注册就有了