用Python去掉字幕文件中的字体标志

MplayerX是MAC OS X下很流行的视频播放软件,能够自动加载同视频文件同名的srt字幕文件并且能够正常的显示中文字幕。但是从射手等字幕网站下载的字幕文件中,有的带有类似{\fn微软雅黑\fs7\c&C0C0C0\3c&000000}格式的字体标志,MplayerX并不识别这些字体标志,只能按照原样显示出来,字幕很坑爹,乱七八糟的不好看。
用python可以很轻松的把这些字体标志都去掉,程序代码为:

#! /usr/bin/env python
import re,codecs,sys

def remove(srcfilename, desfilename):
src = codecs.open(srcfilename,'r','utf-16')
des = codecs.open(desfilename,'w','utf-16')
strinfo = re.compile('[\{\S*\}]')
for line in src:
#des.write(line)
#print line
des.write( re.sub('^\{.*\}','', line) )
src.close()
des.close()

if __name__ == '__main__':
remove(sys.argv[1],sys.argv[2])


在MAC下直接运行这个命令

chmod +x ./parse.py
./parse.py 原字幕文件 新字幕文件
[ad#bottom banner of pages]

评论

此博客中的热门博文

SSH代理使用说明

BuyVM黑掉了

PhotonVPS的Xen VPS性能