视频文字提取技术研究与应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:jiachengpu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频文字直接承载了高层语义信息,因此,如果能够有效地提取视频中的文字信息,对高速增长的视频内容的高效检索、理解和复用将具有重要的作用。传统的OCR技术不能完全解决视频中的文字信息提取问题,特别是复杂背景中的文字。因此,需要从理论和技术上提供有效的解决方案。视频文字信息抽取的技术难点主要来源于5个方面:(1)复杂背景中的文字定位以及退化文字的定位问题;(2)种类繁多的字符图像二值化问题;(3)复杂背景中的字符切分问题;(4)粘连字符的切分问题;(5)退化字符的识别问题。本文围绕着视频文字信息抽取这一领域,针对其中的若干问题展开了研究工作。本文的主要工作包括:1.为解决各种类型的字符图像二值化问题,提出了一种多二值图像融合的字符图像二值化算法。算法首先从不同的角度提取图像的信息,得到不同的二值图像,然后把这些二值图像融合,得到最终的二值图像。对比其他字符图像二值化算法,该多二值图像融合的算法能大大地提高字符识别系统的性能。2.为解决字符的切分问题,分析了字符图像的特点及字符切分的难点,提出了一种基于启发和识别的字符切分算法。算法能同时对粘连字符及复杂背景中的字符进行较准确的切分,同时能去除切分单元中的“噪声”成分,克服了启发式字符切分算法的某些缺陷。3.为解决退化字符的识别问题,提出了一种基于融合图像的字符识别算法。对比字符的二值图像和灰度图像,融合图像既能保留有用的字符笔画灰度信息,同时能去除无用的背景信息,提高了字符识别系统的性能。该字符识别算法同时能较准确地给出识别结果的置信度,结合基于词的二元及三元统计语言模型,利用连续多个字符切分单元的上下文信息,进一步提高了字符识别率。4 .提出了一种图像中的文字定位以及视频中的文字提取算法。图像中的文字定位算法首先基于字符笔画的双边缘模型得到候选文字区域,然后对候选文字区域进行分解得到精确定位的文本块,最后基于启发和字符识别对文本块进行验证。视频中的文字提取算法每隔若干视频帧取一帧进行基于图像的文字定位得到文字对象,然后在视频帧序列中对文字对象进行向前和向后的跟踪,最后对文字对象进行识别得到文字提取结果。本文针对视频文字提取的技术难点,特别是退化字符及复杂背景中字符的切分与识别问题,提出了一些解决方案,取得了一些研究进展。
其他文献
本文通过阐述对于民国婚姻问题的研究设想,提出在婚姻史及妇女史研究中应充分重视观念史的探索,不仅要关注观念本身的呈现过程及其内涵的层次性,而且要关注观念的社会化问题
本文试图通过对欧美、日本等美发沙龙店空间类型与风格的解析,试图梳理、认识美发沙龙店功能、空间类型、风格与材质特点,希望对商业空间设计研究提供新的思路。
<正> 拟尺蠖农民称为豆仔黄、八角绿、步曲虫,与棉小造桥虫的形态大部相向。50年泰安区种植大豆,受害面积348,458亩,每亩被害后减产20.2市斤,计减产7,036,553斤:汶上县发生面
期刊
公共受托责任赋予了国家治理新的内涵与要求。政府审计是国家治理的重要工具与要素,但传统审计功能并未形成与国家治理要求相适应的转变。文章突出了政府审计功能的研究,建议
中等职业教育应该始终以培养理论素养与实践能力兼备的高素质应用型、技能型人才为己任,着重培养学生的动手操作能力。《电工基础》是一门实践科学,尤其需要培养学生的实践操
根据光温对作物叶面积的影响,提出了辐热积(product of the rma leffectiveness and PAR,TEP)的概念。根据试验资料构建了利用辐热积模拟番茄(Lycopersicon esculentum Mill)
现代漆画艺术秉承传统的漆画工艺、技法,糅合了当今绘画艺术的材料和风格,使自身的艺术形式更加丰富。站在艺术发展的角度,从漆画的材质与肌理两方面探讨漆画的绘画形式与艺
新民主主义革命时期,中国共产党和国民党分别制定和实施了一系列婚姻家庭法,但是它们在妇女政治地位、经济地位、婚姻地位及军婚问题上各有侧重。对中国共产党和国民党在新民
随着目前科技的发展,对于系统的控制精度、速度以及抗干扰性的要求也越来越高,因此,对于新控制理论的研究和对传统方法的改进成为现在控制理论研究的重要部分。球杆系统是一
在汽车的高速发展与能源、环境的矛盾日益突出之际,汽车发动机燃用代用燃料成为各国政府解决能源、环境问题的重要措施。相对于无水乙醇汽油,含水乙醇汽油具有明显的价格优势