基于多方法融合的文本定位算法的设计与实现

被引量 : 3次 | 上传用户:sck1028
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景文本定位是一个具有很大难度和挑战性的研究课题。自然场景图像中包含许多有用的信息,如商店名称、街道名称、交通标识等。准确地从自然场景图像中获取文本信息是数字图像处理中一个重要的研究内容。要提取自然场景中的文本,首先要找到文本的区域,然后才能交给文本识别模块OCR进行识别。虽然已有许多研究者对自然场景的文本识别做了深入的研究,但就目前的发展状况来看,自然场景文本识别准确性远不及人们所期望的效果。本文考察了现有的主要文本定位方法与目前研究所面临的难题,分析了主要文本定位方法的优缺点,提出了基于多方法融合的文本定位算法。该算法既考虑文本的形状边缘信息,又考虑文本的颜色信息,充分利用了基于边缘、基于学习和基于区域三种方法的优点。本文设计的算法包括预处理、金字塔分解、边缘提取、形态学运算、先验知识限制、各子图像结果合成、备选文本区域提取、神经网络分类和连通区域分析九个步骤。首先运用彩色边缘检测方法对金字塔分解子图进行边缘提取,然后用数学形态学进行文本定位,从而得到一个备选文本区域集。将备选文本区域集标记为文本区域和非文本区域,并作为神经网络学习的训练集,最后用训练好的神经网络对输入图像的备选文本区域集进行分类,获得输入图像的文本区域。在边缘提取阶段,为了满足文本区域定位的具体要求,本文在分析经典边缘检测算子的基础上,提出了一种CROstu彩色边缘检测方法。经该方法处理后的文本区域更清晰,且字符形状保持较好。在神经网络分类阶段,我们使用方形区域内“米”形范围内像素点的RGB值作为输入特征并使用BP网络将像素点分为文本像素点和非文本像素点,该方法避开了特征构造和分类过程中的阈值选择。实验结果表明,本文所提出的文本定位算法不但可以较准确的定位出相应的文本区域,而且具有一定的理论意义和较大的使用价值。
其他文献
节能环保已经成为人们的共识,世界各国对可持续发展认识的提高及日益加剧的能源危机,使人们认识到未来将是一个新能源大规模应用的时代。由于光伏发电具有清洁性、安全性、资
民族贫困地区农村小学生思想道德状况,不仅直接关系到小学生身心健康,而且关系到国民素质水平及国家的前途和命运。在新课程改革背景下,民族贫困地区农村小学德育校本课程开
传说是历史与文学的桥梁。因此,传说与历史,只有一步之遥。民众出于某种需要,把历史加以传奇化,就形成了传说。在中国民间传说的海洋中,大部分的历史人物传说就是由此种途径
孔子的天命鬼神观念一直是讨论孔子思想的一个重要组成部分,它不仅关系着孔子个人的信仰,还决定着孔子之后整个儒家对待天命鬼神的信仰和态度,可以说是一个中国哲学和宗教的
改革开放三十年来,我国旅游业得到了很大发展,并逐渐成为国民经济的战略性支柱产业。当前,我国旅游业面临着转型升级的重要任务,国务院也于2009年底提出了《关于加快发展旅游
本论文从光源的角度入手,阐述了光源对翡翠绿色评价的影响,首先计算了光源(D65、A)的显色指数、总结了三种不同照明光源下翡翠样品颜色指数特点,分析了照明体引起的两翡翠样
随着我国工业化、城市化进程的不断加快,如何协调发展与保护的关系是当前土地管理工作的重中之重,建设用地的集约利用也日益受到关注,其必将成为土地可持续的利用的重要途径
在欧洲,女性观念一直存在于古典文明和中世纪文明中。俄罗斯中世纪经历了七百多年漫长的发展过程,晚期深受欧洲文化的影响和冲击,其女性文化特征主要表现在宗教、社会和家庭
基金定期定额投资业务有投资成本加权平均的优点,能有效降低整体投资的成本,使得价格波动的风险下降,进而提升获利的机会,因而日渐受到投资者青睐。本文首先根据自身情况,选
前不久,听了一节写作公开课,引发了我对“写作观察”真实性的思考。这节写作公开课的主题是:人物动作、神态描写。教师为了引导学生观察人物的动作、神态,创设了真实的情景:
期刊