绿茶软件园
首页 > 软件下载 > 媒体工具 > 影音其他 > 硬字幕提取工具 V10.0 官方最新版
更多下载地址
硬字幕提取工具 V10.0 官方最新版

软件大小:3.05G

软件语言:简体中文

软件授权:免费软件

软件类别:影音其他

软件等级:

更新时间:2025-03-20

官方网站:

应用平台:Win2003,WinXP,Win7,Win8,Win10

  • 软件介绍
  • 软件截图
  • 下载地址

  硬字幕提取工具是一款小巧易用的字幕提取软件,可以帮助用户快速提取对应视频的字幕内容,软件覆盖了VideoSubFinder、SubtitleEdit、以及百度讯飞搜狗OCR的一个工具,方便实用。软件采用AI文字检测+传统的数字图像处理技术,提取字幕图片和时间轴信息,然后利用百度讯飞有道OCR通用文字识别云引擎+离线ocr引擎识别出文字,在校对窗校对后生成srt字幕文件,最后还可选调用第三方工具APP做调轴补漏等工作,从开始到结束,整个字幕提取流程一气呵成,快速准确、识别率高、省时省力。有需要的朋友欢迎下载使用!

【功能特点】

  支持“双语字幕”识别、字幕翻译、动态字幕等功能

  支持字幕保存,导入等功能

  支持在线翻译功能。

【使用方法】

  1、准备百度OCR服务APP_ID / API_KEY / SECRET_KEY

  百度注册获取百度通用文字识别服务的APP_ID / API_KEY / SECRET_KEY,

  一个手机号码注册一个账号(须实名认证)。

  每账号每天免费识别次数有规定,如不够用可多注册几个账号。对于长期需求用户,建议购买次数吧,价格不贵,还能支持国家高科技发展。

  注册步骤很简单,可自行百度,获得的APP_ID / API_KEY / SECRET_KEY信息先保存起来下面会用到。

  如果您现在没时间注册,可以下载本工具支持离线OCR识别的版本,使用里面的离线ocr来识别,本步骤可略过。

  2、准备工作流程中最后可能用到的APP2第三方软件

  百度下载安装Subtitle Edit 作为 APP2

  注:APP2 不指定,可以选用户熟悉的其他软件,例如SubtitleEdit可换成Aegisub或 ArcTime

  如果对提取的字幕不需要精调,只是一般使用,本步骤可略过。

  如果是离线OCR版须安装包内的vlc-3.0.12-win64.exe,不然智能截图不能工作。

  3、设置硬字幕提取工具

  打开软件

硬字幕提取工具1

  点击‘系统设置’

  填入步骤1获得的百度OCR服务APP_ID / API_KEY / SECRET_KEY(如使用离线ocr引擎则不用做此步)

  点Browse找到步骤2安装好的AP2P的入口exe文件(如不需调轴补漏则不用做此步),然后Save保存设置。

硬字幕提取工具2

  4、用VideoSubFinder_5.50_x64生成RGBImages

  点击主界面VideoSubF按键,将启动运行VideoSubFinder_5.50_x64(旁边的‘智能截图’按键是类似于VideoSubFinder的另一个截图工具,采用AI文字检测+传统的数字图像处理技术,善于提取复杂动态字幕并能做到100%不漏,高级用户可学习第四章之-高级功能)

硬字幕提取工具3

  点击左上角File -> Open Video(FFMPEG)(如不能打开视频,可换OPENCV),打开要提取字幕的视频文件(本例为:倚天屠龙记之魔教教主-中字.mp4)

  快速浏览全片,查看字幕区间矩形最大范围(注意有些视频是两层字幕),用两根竖线两根横线设置字幕截图区间(四根线在视频窗口边缘不容易发现,试着点击选中可以移动它)。注意:矩形边框要比实际字幕稍大,不要为了节省图片尺寸而把区间设置成紧贴字幕,如果字幕周边余量太小,会影响后续百度OCR识别(当然也没必要设置得太大)。

硬字幕提取工具4

  点击Search右边的Settings,出现设置界面,我们只关心左边这块能影响Search字幕图片的参数。

硬字幕提取工具5

  第一个参数‘Text Alignment’默认设置是‘Center’,须点击设置成‘Any’。

  其他众多参数中,有一个参数至关重要,就是Use Filter Colors这项,default值是空的,其他参数可以不设,这个一定要设置上,特别是非纯白字幕,例如黄色!如果不设置,有大几率会漏字幕。

  我们需要取色字幕文字的骨干颜色(骨干外则是字幕轮廓颜色,不要取偏了),然后将颜色值填入,将有助于VideoSubFinder判断字幕出现和结束的时间,生成正确的时间轴信息,并防止丢时间轴。常见字幕颜色可能有白色的、黄色的,或者其他颜色,本例电影的字幕是白色。如果是多色字幕,可以按VSF要求取色多色填入。

  具体的参数设置,可以参考Docs目录下的readme_eng.txt,专业用户精调参数可以提高Search字幕帧的准确率,从而减少丢时间轴(少字幕图片,致命)和假时间轴(空字幕图片,影响不大)的情况,不过据笔者使用经验,如果没弄明白参数含义和作用,随意调整反而适得其反,普通用户还不如不调的好。

  在右边界面先点一下Pixel Color

硬字幕提取工具6

  然后点击字幕白色文字中心骨干取色,点不准可以多点几下。

硬字幕提取工具7

  取到了颜色,会显示出来

硬字幕提取工具8

  本例将Lab: l:245 a:127 b:129 拷贝后双击填入Use Filter Coloers,一般做了这步就可以基本保证不会有时间轴丢失的情况,算是完成了Search的设置。

硬字幕提取工具9

  点击Search -> Clear Foders 清空RGBImages目录,

  然后点 OCR Search,程序开始扫描视频文件,生成RGBImages。

硬字幕提取工具10

  几分钟后扫描完成,可以关掉VideoSubFinder_5.50_x64,这时工具将显示RGBImages目录下的所有字幕截图:

硬字幕提取工具11

  初次使用我们可以在文件列表区按鼠标右键菜单,选‘Open folder’打开RGBImages目录看一下:

硬字幕提取工具12

  这些是刚才VideoSubFinder_5.50_x64 Search生成的1000多个字幕切片图片文件,说明这个电影有1000多条字幕呢。文件名前段为时间轴信息。

  可以打开文件看看,是RGB原色字幕截图切片,很适合AI训练过的OCR引擎做识别。

硬字幕提取工具13

  5、清理空字幕图片

  我们可以在‘删合窗’中清除RGBImages目录中的空字幕图片。

  由于VideoSubFinder 的Search算法还没做到100%准确,所以会误生成少量无字幕空图片(假时间轴),有时还会把广告也截图下来,我们在‘删合窗’中用鼠标滚轮快速翻页浏览RGBImages目录,把发现的空字幕、广告水印图片打上删除标记,标记完最后统一删除,让后续百度OCR识别不用浪费每月有限额度,同时在校对阶段不用再频繁做删除工作。

  一页可以显示20~300张图片(默认90张),浏览、标记、删除非常方便。

  翻页:点击<<<、>>>按键,或键盘PgUp/PgDn键、↑/↓键,或将鼠标指针停留在图片区,滚动鼠标滚轮,可以翻页。

  标记:鼠标左键点击可以标记选中图片,再次点击可以去选中。Shift+鼠标左键可以连续多选、连续去选(可跨页)。

  删除:直到最后一页标记完成,点<<面板上的‘全删合’按键会弹出删除提示,确认后将删除所有标记过的空图片。

  更多方便的功能(例如合并重复字幕)可以看“第四节之 视频截图、删合窗(删除合并)”

  如下图一处为广告,可以选中标记它:

硬字幕提取工具14

  如下图几处为空字幕图片,可以选中标记它:

硬字幕提取工具15

  一直标记到最后一页:

硬字幕提取工具16

  然后点‘全删’,

硬字幕提取工具17

  确认后将会把刚才标记过的所有空字幕、广告水印图片删除掉(如果发现不能删除,多半是系统权限问题,请不要将本工具安装在C盘或桌面):

硬字幕提取工具18

  清理完空字幕图片后,点击面板上的‘去OCR’按键,将切换到OCR校对窗。

硬字幕提取工具19

  6、运行百度OCR识别

  百度高精度每月免费识别额度较低,如不采用叠图技术 --- 将多张字幕图片合成一张大图来识别以节省额度,每月只能识别较少字幕图片,因此,如果用户没有购买额度,应该在面板上勾选‘叠图’。

硬字幕提取工具20

  如果没有注册百度,而是采用离线识别引擎可选tr并去掉勾选叠图。

  点击主界面的OCR按键,程序将连接百度OCR服务器,对RGBImages目录中的所有字幕图片从头到尾按顺序做识别,只需等待完成即可。

硬字幕提取工具21

  OCR识别完成了! (细心的用户可能会留意到:在识别过程中有少量图片会有自动标注‘X’,这是因为程序在OCR识别过程中会自动标注空字幕图片,因为上个手动删空步骤遗留了少量空字幕图片,所以呢,如果你额度充足,是可以不用做手动删空步骤的)

  这时在RGBImages目录下已经为每个.jpeg文件生成了一个同名的 .txt字幕文件,以及检测框坐标文件_boundingbox.txt,初次使用可以看一下。

硬字幕提取工具22

  7、校对字幕

  如果希望在SubtitleEdit等字幕软件中做校对,可以略过这个步骤,直接到下个步骤

  校对窗显示一页1~4列、1~10行(默认1列6行)图文。用户可根据需要在系统设置里设置。

硬字幕提取工具23

  编辑:可以用输入法进行常规的输入、删除、鼠标左键/右键插入空格、回车等操作。

  查找替换:除了支持简单的批量替换,还支持* ?通配符、反斜杠转义等扩展找替换、正则表达式匹配替换等。

  翻页自动保存:点击<<<、>>>按键,或键盘PgUp/PgDn键,或将鼠标指针停留在图片区,滚动鼠标滚轮、或↑/↓键,都可以进行翻页。翻页将自动保存校对修改过的文字。

  选中标记:ctrl+鼠标左键 可以标记删除图片,shift+鼠标左键 可以标记合并图片,再次点击可以去选中。

  删除合并:如果有选中的图片,这时<<按键盘<Delete>按键会弹出删除合并提示,OK确认或<Enter>将执行删除、合并。

  删除合并范围:当前页+后1页=2页内,后向跨页合并是可能的。

  校对完成后,按面板上的‘生成SRT’按键,将在RGBImages目录下生成123.srt文件:

硬字幕提取工具24

  可以大概浏览一下,然后关掉。

  生成SRT文件后,如时间轴不需要再调整、字幕不需要比对原视频做补漏(要求不高),则至此字幕提取工作完成。

  更多方便的功能(例如‘精准对齐’,‘鼠标左右键自定义功能’,‘字体选择’,‘字号调整’,‘每行字号单独调整’)可以看“用户手册之第四章之 校对窗”

  生成SRT文件后,如需调整时间轴、比对原视频做补漏,点击面板上的‘SubtitleE’按键,将打开SubtitleEdit工具编辑123.srt字幕文件。

硬字幕提取工具25

  8、用SubtitleEdit编辑字幕文件

  之所以前面在校对窗做过校对,这里又用到APP2来做编辑,是因为有些用户(例如字幕组)对字幕要求高,还需要做调轴、补漏等进一步校对工作。

  在波形图窗口里,“点击以添加波形”,打开视频文件,本例是‘倚天屠龙记之魔教教主-中字.mp4’,将生成波形数据:

硬字幕提取工具26

  在波形图窗口,勾选‘选择当前播放时刻的字幕’,设定播放速度,例如200%,然后开始播放视频,字幕会同步显示在播放窗口,可随时暂停播放,进行字幕校对、补漏、调轴。

  该删除的删除,该修正的修正,该替换的替换,改补漏的补漏、该调轴的调轴,注重细节的用户还是认真过一遍吧。

  完成字幕校对后,点击“文件->另存为” 保存校对好的字幕文件,SubtitleEdit会自动将123.srt重命名为跟视频文件同名的srt文件“倚天屠龙记之魔教教主-中字.srt”,并保存在视频文件所在目录下,方便大多数播放软件播放视频文件时自动加载同名字幕文件。

硬字幕提取工具27

  至此,整个硬字幕提取流程就走完了。

软件截图
  • 硬字幕提取工具 V10.0 官方最新版
  • 下载地址
普通下载地址
  • 热门软件
  • 热门标签
idm下载器 v6.32.1 简体中文版 火绒安全软件 v4.0.74.12 官方版 鲁大师最新版 v5.15.18.1120 官方版 百度网盘2018最新版 v6.5.0.3 官方版 360安全卫士2018最新版 v11.5.0.2016 官方版 鲁大师2018最新版 v5.15.18.1120 官方版 谷歌浏览器 dev v72.0.3610.2 官方版 360安全卫士最新版 v11.6.0.1030 官方版 cpu-z 64位 v1.87.0 绿色版 易大师网络工具箱 v2018.11.15 绿色版 火绒安全实验室 v4.0.74.13 官方版 tablacus explorer v18.11.14 绿色版 firefox浏览器 v63.0.3 官方版 瑞星安全云终端软件 v3.0.0.84 官方版 优启通u盘启动盘制作工具 3.3.2018.1017 官方最新版 傲游浏览器(maxthon) v5.2.6.600 最新版 金山毒霸11 v4.5 官方正式版 万能驱动助理win10 64位/32位 v7.18.1018.1 官方版 火狐浏览器(firefox) v64 beta10 官方版 自由天空万能驱动助理win7 32位 v7.18.1018.1 官网正式版 360安全卫士win10版 v11.6.0.1027 官方版 2345加速浏览器2018 v9.5.1 官方版 驱动人生7 v7.1.18.58 官方版 qq浏览器2018最新版 v10.3.2727 官方版 瑞星杀毒软件2018 v24.17.04.64 官方版 蓝梦大华监控录像恢复软件 v1.60 官方版 360安全卫士 v11.6.0.1027 官方版 美图秀秀2018电脑版 v6.1.0.1 官方版 glary disk cleaner v5.0.1.154 官方版 bkviewer(数码相片浏览工具) v5.1j 绿色版 wise registry cleaner v10.1.2 中文版 wise disk cleaner free v10.1.3 中文绿色版 图片工厂(picosmos tools) v2.1.1 官方版 wine(linux模拟器) v3.20 官方版 adobe illustrator cc 2019 v23.0 64位中文版
返回顶部