自然场景图像文本定位与识别

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:xuxu517
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用机器定位与识别自然场景图像中的文本信息,不仅可以提高信息处理的效率,还能大幅简化人们的工作,节省大量的劳动力,因此自然场景图像文本定位与识别技术被用于生产与生活等各个领域。在文档文本定位与识别技术较为成熟的今天,自然场景图像文本定位与识别技术还是略显不足,因此对于自然场景中文本的定位与识别算法依然是一个十分热门的研究课题。本文通过对自然场景中英文文本与中文文本的分析,分别针对自然场景英文定位、中文定位以及场景汉字识别三个方面的不足提出一些新的方法,因此本文的主要研究内容为:第一,针对现有的自然场景英文文本定位算法对于倾斜文本定位效果不佳且运行速度较慢的问题,提出一种基于最大极值稳定区域(Maximally Stable Extremal Regions,MSER)结合层次聚类的快速自然场景倾斜英文文本定位算法。算法首先通过MSER椭圆拟合算法快速地定位出图像中疑似文本区域,并根据拟合椭圆自身与空间特征快速地滤除非文本区域。利用层次聚类的思想将分散的文本区域由小至大层层融合,并且在融合的同时还能删除遗漏的非文本区域,实现快速有效地对自然场图像中倾斜的英文文本进行定位。第二,针对当前自然场景中文文本定位算法中对于汉字笔画融合效果不佳,且根据汉字连通区域形态特征的非文本区域过滤效果不佳的问题,提出一种MSER结合支持向量机(Support Vector Machine,SVM)的自然场景中文文本定位算法。这种算法首先通过MSER剪枝算法快速的定位出图像中的候选笔画区域,再利用一种基于笔画宽度变换(Stroke Width Transform,SWT)的动态闭运算笔画融合算法有效地融合图像中文字的笔画,解决了笔画融合不佳的问题。再对文本图像提取Gabor与方向梯度直方图特征(Histogram of Oriented Gradient,HOG)的388维特征,利用样本训练过后的SVM完成对非文本区域的过滤,在最后的自建中文定位数据集测试中也取得了预期的结果。第三,针对传统文字复杂度汉字识别中,文字复杂特征提取各个像素之间缺少联系的问题,提出一种改进的文字复杂度汉字识别算法。首先将文本图像经过去噪、倾斜矫正以及骨架提取这3步预处理,再通过改进的文字复杂度提取方法获得文字的方向统计直方图,利用直方图中的8维特征数据做为BP神经网络的输入,利用模糊输出的方式构成BP神经网络的输出,使用训练样本对BP神经网络进行训练,最后再利用训练好的BP神经网络进行识别,最后在识别测试中,相较于传统文字复杂度汉字识别方法,汉字识别率有很大提升。
其他文献
设计了基于FPGA的谐振式微悬臂梁传感器接口电路,将接口电路与谐振式微悬臂梁传感器组成闭环自激振荡系统。为满足接口电路智能化与输出频率稳定性的要求,设计了带有自动扫频
招聘和选拔不仅是人力资 源管理的第一关,对于企业的 生存和发展也具有战略意义。在人力资源管理的5P模型,选人是起点。因此,招聘当之无愧地成为企业能否保持持续竞争力的最
本软件是用于《地籍测量导线观测记录)后续数据处理的PC─1500系列机软件。对记录的成果可进行归算、分类,组织平差计算数据。其数据可直接传送至《地籍平面控制测量数据处理软件》(DJ─
文章以关爱自闭症儿童题材动画短片为例,将培养大学生的社会责任感融入大学生动画创作,采用动画这种人们喜闻乐见的形式,达到教育目的,又可解决目前部分大学生动画创作水平不
本文讨论了低温煤焦油的生成、化学组成、改性工艺及其在粉煤浮选中的应用。
中国石化扬子石化2.0 Mt/a重油催化装置配套建设的烟气除尘脱硫脱硝设施采用美国DUPONT-BELCO公司的钠法EDV脱硫工艺+臭氧LoTOxTM脱硝技术,将催化再生烟气净化后排放。烟气除
花药发育和花粉形成的各个步骤由众多基因控制,一些转录因子通过调控花药发育相关基因的表达,是功能性花粉形成的关键因子。MYB类转录因子作为植物中最大的转录因子家族,是其
众所周知,决定人体舒适条件的因素很多,温度、湿度、风速是人体舒适感的三大要素。汽车空调的作用就是使车厢内的空气温度、相对湿度、空气的流速、空气的清洁度达到人体所需要
如何实现边疆民族地区的跨越发展,是一个重大的理论和实践问题。中华人民共和国成立以来,云南以马克思跨越"卡夫丁峡谷"理论为遵循,基于自身特殊的自然环境和历史条件,不断推
为鼓励视频服务提供商参与到缓存过程中,本文提出一种基于Stackelberg博弈的激励缓存资源分配算法。与传统激励缓存资源分配方案不同,本文考虑同时存在多个网络运营商和多个