视频文本检测算法研究

来源 :中国科学院研究生院(自动化研究所) | 被引量 : 7次 | 上传用户:loupee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
让计算机自动理解视频文件的内容,并利用得到的信息去推动视频管理、检索、数据挖掘等应用,是目前的一个研究热点。视频中的文本信息与视频内容紧密相关,为视频内容理解提供了重要线索。面对大量视频,如何快速、准确的从中提取文本信息,是一项有意义的研究课题。本文旨在设计一个通用、有效的视频文本信息提取系统,针对系统设计时遇到的问题开展研究工作。按照处理顺序,系统包括预处理、文本定位、抽取和识别等环节,本文主要研究前三个环节。1.预处理是指文本定位前的准备工作,包括从视频中解帧、对视频图像的质量进行评价和系统的初始化。在实际应用中,由于处理的视频图像质量差别很大,对于不同质量的图像,处理方法也不尽相同。为扩大系统的适用范围,需要考虑图像质量对处理流程的影响。本文提出了一种无参考图像质量评价算法,首先根据自然场景统计规律从图像中提取幅度衰减和位置相似性两方面特征,构成特征向量,然后训练广义回归神经网络对图像质量进行评价。2.文本定位是指从视频图像中准确的标识出文本块的位置。本文提出了一个快速有效的处理流程,首先对图像求边缘,针对边缘图像中经常出现的断裂和粘连现象进行修补,然后标定并筛选连通域,根据位置信息对连通域进行排序,根据几何约束对连通域进行局部搜索以构建文本块,完成粗检测,最后进行文本块融合以去除重复检测区域,进行文本块验证以去除虚警区域。3.文本抽取是指从文本块图像中抽取字符笔划。对于文本块图像,由于字符颜色不确定和存在背景干扰,不能将其直接送给字符识别引擎进行识别,而应加入文本抽取环节。本文提出了一套稳定的抽取方案,首先对文本块图像进行二值化和极性判断,以确定文本所在的二值图像,然后利用视频的时间冗余特点对文本块进行多帧验证和增强,最后对增强后的文本块进行二值化和连通域筛选,生成干净的二值图像,方便后续处理。文中给出了相应的数据集和实验结果,验证了算法具有较好的性能。
其他文献
本文论述了漳州水果生产应立足优势、突出特色、合理布局、规模发展;提出了狠抓采后商品化处理,提高加工、保鲜技术水平,加强漳台合作和高产优质栽培技术示范,提高漳州水果生产产
蓝山咖啡,咖啡之王!蓝山咖啡产于加勒比海的牙买加岛,该岛横贯着许多山脉,这些山脉斜坡就是牙买加咖啡的主要产地.而位于牙买加首都东北方的蓝山,只是这些山脉群中的一座山峰
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
<正>近年来,教育产业受到资本青睐,在线教育市场火热,企业竞相发力资本、技术、产品三大"赛道"。目前,在线"1对1"模式是最受追捧、跑得相对靠前的商业模式。同时,人脸识别、
当今,计算机图形学的一个重要应用是真实景物的建模和浏览,例如虚拟博物馆等方面。常用的以三维网格为基础的绘制方法很难达到这方面的应用需求。一方面,这种方法使用简单的
一元复始,万象更新。在各级工会财务人员的辛勤忙碌中,我们送走了不平凡的2004年;在金鸡报晓的喜庆声中,我们又迎来了充满希望的2005年。在新的一年里我们将坚持以邓小平理论
期刊
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议
现代电气自动化系统凸显出的网络化优势加强了电气信息的应用,能在复杂的工作情况下提高火力发电的效率,提高火电厂的管理水平和经济效益,促进了电气控制的稳定性,有显著的社
工作流管理技术是最近几年来在计算机领域中发展最为迅速的几种新技术之一,并且已经成为当前IT 领域的一个研究热点。同时,工作流技术作为现代企业实现过程管理与过程控制的
应用蚕桑生产方式省力化技术,既能节省劳动力投入,提高生产效率,又能改善饲养环境。近年来,陇南地区在栽桑养蚕省力化发展上有所创新,但也存在技术研究应用程度低、推广面积