1、格式工厂似乎没这功能。
2、如果是含外挂字幕的视频(一定是外挂字幕的视频,而且是mkv格式)。
3、那就用mkvextractgui提取字幕,很容易,拖文件进去,勾选字幕文件,再点确定即可。
二、如何提取MP4视频字幕1、格式工厂似乎没这功能。
三、【图片】【开篇】常用高清内挂字幕视频字幕提取及OCR处理_pt吧1、本文章备档留以后使用。
3、提取部分序一部内挂字幕的高清影片,一般会有电视录制版ts格式,蓝光版m2ts格式,常用mkv格式,其他在高清的领域不常接触不涉及。
4、因为绝大多数影片内挂字幕都是不清楚的而且错误很多,字幕又不完整,比如只有中文繁体、或者简体,甚至只有英文,想要做双语甚至的时候就需要提取并OCR了。
5、名词解析、内挂字幕、视频和字幕在一个文件里面,正常手段是秤不离砣的。
6、特殊情况不要来扰。
7、ts、m2ts、mkv、都是一种封装格式,多用于高清视频。
8、蓝光、多指蓝光光盘,目测目前清晰的视频质量,但不同的会有差别,这里谈的都是从蓝光盘里提取出的文件,常为广大PT爱好者存储于硬盘上。
9、提取、即把视频里面的字幕资料提取出来,一般有图片形式的字幕和纯文字的字幕,碰到纯文字的字幕那你幸运了,碰到图片形式的字幕就需要OCR了。
10、OCR、即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
11、如何除错或利用辅助信息提高识别正确率,是OCR重要的课题。
12、说的通俗一些就是把图片文字识别成纯文字资料。
13、双语、中英双语字幕,如果你经常光顾CMCT会发现他们的东西很多都是双语的,有中上-英下,和英上-中下两种情况。
14、、非简单的黑底白字字幕,会做一些就像是ps效果一样的处理。
15、阅读起来赏心悦目,美感十足,大爱CMCT,看电影本来就是享受的事。
16、题外话、其实有需求的朋友在录入手头的一篇纸质文章的时候可以试试拍成照片并利用OCR软件识别成文字资料,比打字录入快多了。
17、附、本篇文章所有涉及到的软件会提供百度网盘下载。
18、并备注在文章后。
19、测试平台、CPU、I7+win7系统。
20、工具tsmuxer功能强大的蓝光提取工具。
21、多用于蓝光m2ts提取分离音频字幕视频文件等。
22、ProjectX针对ts格式提取idx+sub字幕,据了解可能会有部分不可以。
23、MKVExtractGUI2针对mkv格式,可以提取字幕文件。
24、操作tsmuer常用的有以命令行或gui界面。
25、本篇以gui界面为例、这里分离出了1个“H.264文件”即视频。
26、1个“ac3音频”即音轨。
27、另外一个就是本教程的主角“sup文件”即字幕文件。
28、Sup文件为BDMV及HDDVD高清媒体专用字幕格式。
29、不能直接avs加载,亦不能被常用视频压缩软件识别。
30、须要转换成其他格式字幕文件。
31、后面会谈到。
32、该工具也可用于其他格式。
33、ProjectX个人常用于抽取idx+sub字幕,多用于高清翡翠台节目,需要安装java环境。
34、java安装很简单,下载并一直下一步就OK了。
35、该软件操作说明为借用。
36、第一次执行先按下「IAgree」主窗口中选择工具列中的「PreSettings」,再选「subtitle」页面,有关设定如下(参照下图)(注上图右下角选项「additionalexportasVobSub(idx+sub)」必须打勾才能转换为idx+sub,计算机能读取的档案。
37、(注上图UkFreeview(mc)只适用于TVBJ2台/高清翡翠台的节目,若用于ATV亚洲高清台的节目请选用NRK)设定完成后关闭此页面,返回主窗口在主窗口选择工具列的「File」,再选「Add」,加入TS/MPG文件(注、两者基本上一样,若使用计算机及USB数码电视接收棒录制而成的档案,可分为TS〔一般是使用DVBviewer录制〕及MPG〔一般是使用TotalMedia录制〕)按上图左面Step3的「QuickStart」后,耐心等待其demux而汇出的多个档案,主要可在片源之同一数据夹内找到idx/subx1(字幕x1即繁体中文字幕,X2即片源有第2条字幕,可能是简体中文字幕)sup(对SDMPEG2制作DVD才有用,本教学并无需要使用。
38、)MKVExtractGUI2多用于mkv格式。
40、OCR部分工具SubRipSubRip将Sub图形字幕转为BMP图片SubToSrtSubToSrt将BMP图片转为Srt文本字幕MODI即“MicrosoftOfficeDocumentImaging”office组件,OCR引擎,微软Office2003所带的MicrosoftOfficeDocumentImaging(MODI),支持英文、简体中文、繁体中文、日文。
41、IdxSubOcr一个专门用来OCR(光学字符识别)Vobsub格式字幕的软件,能够将idx/sub格式的字幕转成srt格式,并提供srt格式校对功能。
42、SubtitleEdit可以导入VobSubsub/idx二进制字幕并进行OCR识别。
44、SubToSrt将BMP图片转为Srt文本字幕启动SubToSrt软件,使用前进行一些简单的设置可以让OCR过程更高效选择菜单栏的”设置”>“程序设置”弹出设置对话框第一项”在字幕中加入制作这信息”,个人建议取消勾选,如图10所示因为某些电影一开始便有对白字幕,如果此时插入一条制作者字幕,可能会造成片头的时间轴排序混乱(在对文本字幕时间轴格式不熟悉的情况下,会给使用者带来不必要的麻烦)“输入法设置”一项选择自己常用的输入法并保存,这样在OCR过程中需要手动输入字幕的时候会自动切换至该输入法”词组替换设置”一项建议勾选,软件会将一些习惯词组进行替换(如”荷里活”会替换为”好莱坞”),见图11标注所示,设置完成点保存退出对话框菜单栏点击”文件”>“打开”载入之前转BMP文件阶段保存的.Srt文本字幕,图12所示选择菜单栏的”图片处理”>“自动裁剪”点确定后开始裁剪,裁剪完毕后点”OK”确认,见图图14所示然后点击菜单栏”识别”>“开始识别”SubToSrt开始进行OCR图15所示遇到软件未正确识别或字库没有的字符,会弹出一个字符输入框,根据下方的图形字幕敲入正确字符后回车继续如果前一个字符手动输入错误,可以在右下方的小框内重新输入进行更正,如图16遇到某些字符未能正确识别的,如图17可以看到软件只识别到”咤”的一小部分这个时候,我们可以点击”扩展Extend”按钮来扩展红框的识别范围若不小心多点了几下”Extend”,再点击”取消扩展UndoExtend”就可以缩小红框识别范围调整红框识别范围至合适位置,就可以根据下方的字幕信息输入正确的字符啦,见图18待软件识别完毕,会自动进行时间轴、词组校对检查,确认校对无误后点击”OK”确认。
45、弹出的另存为对话框,选择.Srt字幕存放路径及文件名,见图20如图21所示,可以记事本打开OCR的.srt文本字幕进行查看编辑至此,利用Subrip+SubToSrt把中文Sub图形字幕OCR为.Srt字幕(主要针对简体中文)完成。
46、modi和IdxSubOcr这个篇文章已经说的很详细了,我就不赘叙了。
47、http、//tieba.baidu.com/p/2358545561。
48、直接复制过来方便查看吧。
49、要用到的软件microsoftofficeIdxSubOcr.exe先引用老马的《在简体中文Office2003下OCR繁体中文、日文、韩文》中的一段话、先MODI已经正常安装。
50、Office2003的缺省安装是第一次使用MODI时安装,Office2007的缺省安装是不装,都需要改过来。
51、下载繁体中文识别.zip将下面的文件复制到安装了简体中文Office2003的相同文件夹下、C、ProgramFilesCommonFilesMicrosoftSharedMODI
52、注意导入注册表时必须先关闭所有MODI窗口,导入后再打开。
53、ok!下载日文识别.zip需要从日文MODI复制到简体MODI文件夹下的文件为、JPCODE.UNIJPPRINT.DATJPPRINTDATJPSERHT.DATJPTREE.DATTW_SU.DATTW_US.DATTWRECJ.DLLTWSJISDLL双击reg文件导入注册表后,在MODI的OCR选项卡里,“OCR语言”即可看到“日文”。
54、注意导入注册表时必须先关闭所有MODI窗口,导入后再打开。
55、ok!个人补充对于安装office2007的用户,可将以上文件复制到安装简体中文office2007的相同文件夹下、64位win7系统的是、C、ProgramFiles(x86)CommonFilesmicrosoftsharedMODI
56、OCR引擎为微软Office2003所带的MicrosoftOfficeDocumentImaging(MODI),支持英文、简体中文、繁体中文、日文。
57、动机、目前已经有一些免费的字幕OCR软件,英文的可以用Subresync,中文的可以用SubOCR。
58、但是在使用了这些软件后,我还是决定开发IdxSubOcr,理由如下、希望能够使用方便性方面有所改良。
59、Subresync自带的OCR引擎的识别率很棒,但是每次都要敲几十个字母实在太麻烦。
60、而且还不支持中文、日文字符。
61、SubOCR实在太庞大,而且在某些机器上运行出错准备工作已做好,下面以冒险王的sub+idx字幕(里面包含了繁体简体和英文三种字幕)来演示字幕转换过程到此,繁体字幕已经转换完毕,英文的和简体的字幕就不再演示了,教程到此为止。
62、涉及到OCR有点混乱,其实OCR一般有这么几种情况。
63、idx+subsup针对idx+sub一般是直接转srt,方法有两种分别是6楼和12楼。
64、6楼可以建立强大的字库,12楼正常情况下识别率很高。
65、这里一般都指的是中文简体和繁体。
66、英文下面会另有介绍。
67、sup一般有2种情况,一是直接转srt,二是sup转idx+sub再转srt。
68、中文建议方法涉及工具BDSup2Sub,英文建议直转,直转会涉及到工具SubtitleEdit。
69、下面介绍中文sup转idx+sub再转srt英文sup转srt。
70、此贴必火啊,哪个效率高。
71、BDSup2Sub、需要安装java环境。
72、一般不需要命令行打开软件,所以一笔带过。
73、Ps、(安装java后,在cmd下,进入BDSup2Sub.jar所在目录。
74、键入“java-jarBDSup2Sub.jar”或“javaw-jarBDSup2Sub.jar”。
75、)可以这么打开,但是我们正常安装好jre软件后一般只需要双击BDSup2Sub.jar即可打开该软件。
76、File—Load打开需要转换的sup文件、下面的部分是提高识别率的,一般可以先测试下是否正常,如果识别率低再回头这么调试。
77、例如、为了提高识别率,可以移动字幕位置到黑边上,如图、然后保存为idx+sub格式。
78、即file-save/export,然后save,在语言里一定要选择chinese,(小技巧,快速定位chinese的方法,在该窗口直接在键盘空打chin就自动跳到chinese了)否则后面转srt会识别不了。
79、至此,我们就可以直接avs加载idx压制了。
80、然而idx+sub字幕是图片字幕,受限于字体等因素。
81、可能导致画面看上去不太美观。
82、那就可能需要把sub转换成srt文本字幕了。
83、此处idx+sub转换srt调用6楼或者12楼都可。
84、个人习惯12楼的方法。
86、技术贴,要学习。
四、怎样提取字幕1、导入要提取字幕的MKV等格式视频你可以直接将视频拖至软件的中间列表,也可以点击左上角的“添加待转换视频”按钮,即可添加要转换的单个、多个甚至整个目录下的所有视频文件。《MP4/RM转换专家》也是先引入多核CPU(高可支持到16核CPU)并发转换技术,是业界转换速度快的软件!而它的“暂停|取消”可随时暂停或取消当前的转换,这确实是很人性化的设置。点击右下角的“DVD全能转换”工具,即可将DVD光盘的字幕提取出来,并将各种字幕、音轨、角度等信息以快的速度完整的转换为各种移动设备支持的格式,如MP4/3GP/3G2/AVI等格式。。
2、选择导出AVI格式导入MKV视频即可进入“基本转换参数选择:”对话框,在该对话框选择导出格式为“普通MP4机之AVI/MPEG4格式”。 。
3、从MKV中提取字幕选择好导出AVI格式,进入“设置待转换的视频参数”对话框,直接保持软件的默认参数,视频的效果已经是很好的了,但如果你对视频还有特别的要求,也可以灵活自定义参数。软件还支持各种形式的切割视频,设置视频的音轨和画面风格等等。要从MKV中提取字幕,只需点击上图中的“添加/设置字幕”按钮,接着只需要在弹出的“添加/设置视频字幕参数”对话框中,选择“自动搜索对应字幕”即可。当然,如果有视频的外挂字幕,那也可以选择“手动为视频文件指定字幕文件路径”,这款软件支持几乎所有主流字幕格式,包括srt/ssa/smi/ass/psb/sub等字幕文件。。
4、裁剪视频有需要的网友还能使用软件的“裁剪”功能,将视频进行裁剪。。
五、视频中的字幕如何提取出来?1、导入要提取字幕的MKV等格式视频你可以直接将视频拖至软件的中间列表,也可以点击左上角的“添加待转换视频”按钮,即可添加要转换的单个、多个甚至整个目录下的所有视频文件。
2、《MP4/RM转换专家》也是先引入多核CPU(高可支持到16核CPU)并发转换技术,是业界转换速度快的软件!而它的“暂停|取消”可随时暂停或取消当前的转换,这确实是很人性化的设置。
3、点击右下角的“DVD全能转换”工具,即可将DVD光盘的字幕提取出来,并将各种字幕、音轨、角度等信息以快的速度完整的转换为各种移动设备支持的格式,如MP4/3GP/3G2/AVI等格式。
六、如何提取视频字幕1、打开浏览器搜索“突字幕”,在搜索结果中,选择显示突字幕文字的网址并点击进入。。
2、网站效果特别简约,提前准备好需要提取字幕的视频,点击“开始使用”。。
3、这时会弹出一个二维码登录界面,微信扫描进行登录,登录完成之后,点击右上角“上传视频”。。
4、选择需要提取字幕的视频,点击“打开”,这时会提示是否完成上传,点击“ 完成”即可。。
5、点击提取字幕的视频,会进入到一个字幕窗口,可以看到字幕或更改字幕位置,点击右上方“下载字幕”,会生成一个srt后缀字幕文件,使用记事本可以打开查看字幕。。
6、总结如下:①搜索“突字幕”,进入网址。②点击“开始使用”,扫码登录,点击“上传视频”。③选取视频,上传完成之后,进入到提取字幕视频中,点击“下载字幕”。。
七、如何提取DVD影碟里的字幕文件?1、软件里都会提供字幕载入的选项,点一下即可。
八、游戏怎么提取字幕文件1、游戏内图片要截图做成图片。这拿这个图片做个例子。。
2、首先搜索下载个软件,并安装打开。。
3、添加文件。把刚才的图片添加进去。。
4、点击开始识别。等待进度条完成,会在桌面生成一个Word文件,识别的文字就保存在里面了。
5、来对比下。准确率挺高的。。
6、也是需要保存图片。打开微信--发现--小程序。没有的话就搜出来。搜:传图识字。
7、点击上传图片。拍照或照片都可以。。
8、上传后跳出来如图。点击哪行文字就识别哪行文字。地下的对号是复制文字。目前我知道的就这二个办法。。
九、把srt字幕文件里的字幕文本提取出来不带时间戳1、打开图一字幕软件,如图二。。
2、点击软件文件,选择打开字幕。。
3、然后选择字幕打开了,选择软件上的蓝条。。
4、右键把图一红色方框上的勾选取消了,如图二为取消状态,只剩下文本文字了的。。
5、再一次点击文件,选择另存为字幕。。
6、点击导出,点击所有格式。。
7、选择图一的txt,输入一个名字。注意保存的位置,否则你找不到保存之后的字幕文本。。
8、然后点击保存的之后的文本文件,这些打开之后,就是不带有时间戳的字幕了的。如下图。。
转载请注明出处阿文说说网 » 如何获取字幕文件【字幕文件】