Saber 酱的抱枕

Fly me to the moon

03/31
2023
软件

提取视频内嵌字幕的软件(硬字幕提取器)

提取视频内嵌字幕的软件(硬字幕提取器)

硬字幕是指合并到视频画面里的字幕,它是画面的一部分,而非外挂的字幕文件。

我有一些日语视频没有字幕,我在南+论坛求助,有人发了其中两个视频的硬字幕版本。但是我觉得这俩硬字幕视频经过了重新编码,画质不如原版,所以我想把字幕提取出来,配合原版视频使用。

我找到了一个软件“硬字幕提取器”,这是一个用 Python 结合深度学习框架做的识别字幕的软件,它可以提取硬字幕文字并自动保存为 srt 字幕文件,并且支持多种语言。

我试了下使用起来很简单,而且效果很棒,没有错别字,时间也吻合。

GitHub 主页:https://github.com/YaoFANGUK/video-subtitle-extractor

下载安装包:https://github.com/YaoFANGUK/video-subtitle-extractor/releases

对于 Windows 用户,建议选择 CPU 版本或者 GPU 版本。

提取视频内嵌字幕的软件(硬字幕提取器)

由于我只有两个视频需要处理,为了省事我下载了 CPU 版本。

因为 GPU 版本体积更大,而且可能需要配置(根据说明,或许可以尝试解压后直接用,如果出问题了再安装依赖)。

下载后解压,注意:软件存放路径和视频路径里都不能含有中文、空格。

然后运行 vse.exe,打开软件界面。

提取视频内嵌字幕的软件(硬字幕提取器)

提取视频内嵌字幕的软件(硬字幕提取器)

界面很简单,先打开要处理的视频,在视频下方可以拖动进度条预览。

如有必要,可以使用右下角的滑块来调整字幕识别区域的大小和位置。

然后点击底部的设置按钮,可以设置识别语言以及识别模式。

最后点击运行,等待执行完毕就可以了,它会在视频文件夹里保存一个同名的 srt 字幕文件。


硬字幕视频:

提取视频内嵌字幕的软件(硬字幕提取器)

原视频使用提取后的字幕文件:

提取视频内嵌字幕的软件(硬字幕提取器)

字体有点大,不过这和字幕文件无关,因为 srt 字幕并没有规定字体样式,现在的字体样式是播放器的默认设置。

我使用的是 Potplayer,可以在字幕设置里调整样式:

提取视频内嵌字幕的软件(硬字幕提取器)

我减小了字号并把字体设置为幼圆,取消加粗,看起来好多了:

提取视频内嵌字幕的软件(硬字幕提取器)


由于我下载的是 CPU 版本,所以处理速度会比较慢,而且 CPU 使用率在大部分时间都是全程拉满的。

提取视频内嵌字幕的软件(硬字幕提取器)

我心疼的不是 CPU 的占用率,而是温度……笔记本的散热太拉胯了,全程 90 度就跟烤鸡差不多。

对于这个 2000x1500 分辨率,30 FPS,时长 646 秒,文本里不多的视频,我选择精准识别模式,处理起来花费了 1681 秒。

提取视频内嵌字幕的软件(硬字幕提取器)

如果你有比较多的视频需要处理,使用 GPU 版应该可以大幅节省时间(根据说明,还可以提高识别的准确率)。

提取视频内嵌字幕的软件(硬字幕提取器)

  1. 12345
    Google Chrome 103Google Chrome 103WindowsWindows

    说道开箱即用 还是差一点 每天群里都能看到 有人捣鼓 然后问怎么运行不了
    解压就用还是黄老邪的更胜一筹对小白来说配置环境和申请API 还是简单 API随便注册注册就有了

    回复
  2. 12345
    Google Chrome 103Google Chrome 103WindowsWindows

    还有一个
    https://www.zhihu.com/people/huang-yao-shi-91-46/posts
    https://bbs.acgrip.com/thread-7385-1-1.html
    这个也不错
    我就是发现了这个之后开始制作 SURVIVE MORE 和 SURVIVE 的PPT视频字幕
    而且发在了南+
    而且现在还有漫画字幕提取器
    https://www.basiccat.org/zh/imagetrans/
    https://github.com/dmMaze/BallonsTranslator
    我也制作了一些漫画
    发在了E站
    https://exhentai.org/?f_search=uploader%3Allflzy+uploader%3A%E6%B7%AB%E4%B9%A6%E9%A6%86+uploader%3AL%E6%B7%AB%E4%B9%A6%E9%A6%86L
    现在的工具很方便小白自食其力了 外加最近的GPT加持 更是如虎添翼

    回复
      1. 12345
        Google Chrome 103Google Chrome 103WindowsWindows

        先接触的 这个我从6.3开始用
        用这个工具产出了大概70部 生存社的视频
        虽然我一直在大佬帖子里发的这个工具的群里
        但是因为配置麻烦 所以还是一直用 VCB论坛这个大佬的工具

        回复
      2. 233
        Google Chrome 108Google Chrome 108WindowsWindows

        硬字幕提取工具10.0有内置的本地OCR,不需要百度什么的接口(以前没有内置本地的,所以接口主要是以前用的,现在其实没啥用)。
        最主要的是硬件资源占用与速度,本文git上的那个实在太慢了。如果是长时间大量的视频是没法用那个的

        回复
          1. 233
            Google Chrome 108Google Chrome 108WindowsWindows

            很慢,至少和硬字幕提取器10.0不是同一个赛道的。不光是慢,他那个,扫描间隔设置得短,就慢的要死。设置得长,就会很容易字幕时间延后,甚至会漏掉。应该是完全个人搞的一个软件。硬字幕提取器是把已有的很好用的软件合在了一起

            回复