本帖最后由 風之翼 于 2013-8-10 12:06 编辑
要用到的软件網盤下載:http://pan.baidu.com/share/link?shareid=3452734528&uk=53646035
1.microsoft office(推薦下載地址:點我)
2.IdxSubOcr.exe IdxSubOcrv1.07.rar (179.26 KB)
先引用老马的《在简体中文Office 2003下OCR繁体中文、日文、韩文》中的一段话:
先确保MODI已经正常安装。Office 2003的缺省安装是第一次使用MODI时安装,Office 2007的缺省安装是不装,都需要改过来。
下载一个繁体中文识别.rar
繁体中文识别.part1.rar (3.34 MB)
繁体中文识别.part2.rar (2.69 MB)
将下面的文件复制到安装了简体中文Office 2003的相同文件夹下:
C:\Program Files\Common Files\Microsoft Shared\MODI\11.0
TCCODE.UNI
TCPRINT.DAT
TCPRINT2.DAT
TCSERHT.DAT
TCTREE.DAT
TW_BU.DAT
TW_UB.DAT
TWBIG532.DLL
双击reg文件导入注册表后,在MODI的OCR选项卡里,“OCR语言”即可看到“中文(繁体)”。注意导入注册表时必须先关闭所有MODI窗口,导入后再打开。
ok!
下载日文识别.rar
日文识别.part1.rar (2.86 MB)
日文识别.part2.rar (2.2 MB)
需要从日文MODI复制到简体MODI文件夹下的文件为:JPCODE.UNI
JPPRINT.DAT
JPPRINT2.DAT
JPSERHT.DAT
JPTREE.DAT
TW_SU.DAT
TW_US.DAT
TWRECJ.DLL
TWSJIS32.DLL
双击reg文件导入注册表后,在MODI的OCR选项卡里,“OCR语言”即可看到“日文”。注意导入注册表时必须先关闭所有MODI窗口,导入后再打开。
ok!
个人补充
对于安装office 2007的用户,可将以上文件复制到安装简体中文office 2007的相同文件夹下:
64位win7系统的是:C:\Program Files (x86)\Common Files\microsoft shared\MODI\12.0
32位win7系统的是:C:\Program Files\Common Files\microsoft shared\MODI\12.0
根据自己要转换的字幕的语言安装相应的语言补丁,很抱歉,在网上没有找到韩文识别补丁
IdxSubOcr相关知识补充
它一个专门用来OCR(光学字符识别)Vobsub格式字幕的软件,能够将idx/sub格式的字幕转成srt格式,并提供srt格式校对功能。OCR引擎为微软Office 2003所带的Microsoft Office Document Imaging (MODI),支持英文、简体中文、繁体中文、日文。
动机: 目前已经有一些免费的字幕OCR软件,英文的可以用Subresync,中文的可以用SubOCR。但是在使用了这些软件后,我还是决定开发IdxSubOcr,理由如下:
希望能够使用方便性方面有所改善。Subresync自带的OCR引擎的识别率很棒,但是每次都要敲几十个字母实在太麻烦;而且还不支持中文、日文字符。
SubOCR实在太庞大,而且在某些机器上运行出错
准备工作已做好,下面以冒险王的sub+idx字幕(里面包含了繁体简体和英文三种字幕)来演示字幕转换过程
[冒险王].Adventure.King.1996.REMASTERED.2Audio.DVDRip.rar(1.71 MB)
运行IdxSubOcr.exe,窗口如下
到此,繁体字幕已经转换完毕,英文的和简体的字幕就不再演示了,教程到此为止
|