彩色图像的文本信息提取研究

来源 :东华大学 | 被引量 : 2次 | 上传用户:wuyonghong1974
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机科学、多媒体技术的飞速发展,以彩色图像为主的多媒体信息迅速成为重要的通用信息媒体。在彩色图像中,文字信息(如新闻标题、旁白等等)包含了丰富的高层语义信息,自动提取出这些文字,通过对它们的识别和分析,对于图像高层语义的索引和检索是非常有帮助的。传统的图像文本信息提取方法大多基于字符的代数和几何特征。本文研究比较了边缘、纹理、区域、角点检测等图像文本区域定位算法,分析了这些算法对彩色图像文本信息定位的效率。由于这些传统的方法存在的各种缺陷使之无法将类似字符的景物当作字符识别出来。因此,本文从另一个角度出发,将字符看成彩色图像的一部分,以颜色作为识别的特征,使类似字符的景物也可以被当作字符识别出来。本文分析介绍了Mean—Shift算法的数学模型和物理模型并提出了基于Mean—Shift算法的图像文本信息提取方法。首先利用Mean—Shift算法对图像进行分割,得到分割出来的各颜色子图像。对这些子图像灰度化操作后就是目标文本区域,为了提取其中的有效文本特征,需要对文本区域再次进行阈值分割。本文对比介绍了全局、局部和动态三大阈值分割方法,并根据分割出来的子图像是单色图像的特点选择了全局阈值分割法进行阈值分割。原始图像在经过Mean-Shift图像分割之后,要进行文本中的字符分割,本文采用投影字符分割方法。由于字符在行列间均存在空隙,字符间隙在投影中表现为波谷,此时可以在水平方向和垂直方向进行投影统计,寻找出波谷即可分割出字符,从而得到单个字符并将其分割出来。在字符识别阶段,采用离散Hopfield神经网络方法将字符识别。该方法代码短小、执行快速,具有良好的识别效率。
其他文献
Web服务作为一种新兴的分布式计算模型,具有开放性、平台独立性、松耦合性和可复用性等优点,已经在电子商务、企业应用集成等领域扮演着越来越重要的角色。然而,有时单个服务只
本文在对宁波申洲针织有限公司生产计划制定流程的详细调研基础上,运用管理信息系统和软件开发的一般方法,介绍了基于C/S结构的宁波中洲针织有限公司计划调度管理信息系统的设
本文主要研究从工程测量信号中利用插值傅立叶变化精确提取谐波参数的方法。在系统论述基于插值傅立叶变换的频率精确识别方法的基础上,在Matlab环境下进行了利用插值傅立叶变换对噪声背景下单一频率信号、谐波信号及间谐波信号的频率识别的仿真验证,并针对采样点数、采样频率、以及在采用插值法时不同窗函数对测量结果的影响进行了比较;针对一组汽轮发电机组的升降速信号进行了分析,结合具体实例利用插值法对信号进行分析
突变理论的创立是非线性科学的重要成就之一,随着航空航海工程、电力大系统及复杂生产过程等被控对象的日益复杂化,加之人们对控制系统的性能指标的要求越来越高,复杂系统的
故障注入是一种基于试验的系统测试方法,它主要应用于系统容错机制验证和可靠性验证。软件故障注入是通过软件方法动态地修改目标系统的输入和输出,并形象地演示目标系统在故
近三十年以来,各国脑-机接口(Brain-Computer Interface,BCI)试验室和团队努力实现大脑与外界通讯,并由此实现相应的开环控制或闭环控制。在脑-机接口定义中,“脑”一词意指
随着科学技术和工业的飞速发展,逆变电源越来越广泛地应用于电力、通信、航天等军用和民用各个领域。400Hz中频逆变电源属于特种电源的范畴,通常被应用于航空航天、船舰、雷达、石油、冶金等领域中。为了得到稳定、安全、可靠、鲁棒性强的输出,本文致力于单相400Hz逆变电源控制系统的设计。本文首先介绍了逆变电源的研究背景和发展历程,紧接着概述了逆变电源控制策略。随后,介绍了逆变器的工作原理、逆变器的主电路拓
当前,Web2.0技术的出现和风靡,将我们带入一个崭新的网络时代。而如何去设计和实现一个Web2.0网站的论文更是如雨后春笋般涌现。然而实际的情况却是,传统的Web1.0的网站数目
本文以高速公路上的交通流为研究对象,对高速公路的集成控制和优化进行了研究,研究目的是利用全局优化控制策略提高路网的运行效率。本文详细研究了高速公路控制的研究状况,根据
网络控制系统(NCS)是控制系统和计算机网络有机结合的产物。而仿真是当前针对NCS研究的重要手段。对NCS的研究需要将以往独立的计算机网络和控制理论的研究融合起来,这迫切需要