论文部分内容阅读
数字视频在教育、娱乐及其它多媒体应用中发挥着重要作用。为了满足需求,各种各样的视频分析、检索技术被提出,其中,视频文本包含了丰富的高层语义信息,可用来对视频进行语义标注。
本文研究从视频文件中提取出字幕文本的方法。首先从视频文件中自动截取若干视频帧,对每幅视频帧采用基于Sobel算子的最大梯度算法检测文本边缘;再利用文字丰富的边缘信息,使用方差投影定位文本区域;然后通过计算区域边缘密度过滤虚假文本区域;最后利用数学形态学处理文字边缘图像,通过计算颜色标准差获得文本的颜色信息,从而分割出文本图像。实验表明,本文提出的方法不但可以比较准确地定位视频文本,过滤虚假文本区域,还可以有效去除文字区域的背景图像,提高文字识别率。