自然场景下文本区域定位方法的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:pgglankejianxin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着具有拍照功能电子设备的普及,海量的图片和视频文件每时每刻都在产生,自然场景下的文字识别技术能够帮助人们高效、准确的获取图片中的文本信息,因此得到了快速发展。文本定位是文字识别的首要环节,是当前计算机视觉的研究热点之一,具有十分重大的研究意义。本文以自然场景为研究背景,围绕自然场景下的文本目标定位方法展开研究,以字符笔画为基础特征,在前人研究的基础上进行拓展,提出两种自然场景下文本目标定位方法:第一种是基于连通区域的文本定位方法。首先利用笔画宽度转换将原图像转换为笔画宽度图像,对笔画宽度图像进行有条件搜索获取候选字符连通区域,并利用启发式规则过滤候选字符连通区域,之后提取候选字符区域特征,并训练支持向量机(Support Vector Machine)对候选字符区域进行验证,删除非字符区域,再根据文本特点对字符区域进行合并,最终得到文本目标的位置信息。第二种是基于图结构的文本定位模型方法。该模型将字符个体及字符之间关系进行抽象,首先,将候选字符视为图节点,提出平均角度偏差、非噪声分量、笔画宽度向量三大特征,并由此定义字符能量,来表征节点对象是字符的可能性大小;之后,将相邻候选字符间的关系视为图的边,根据字符间的特征相似性定义链接能量,来表征这两个字符属于同一文本的可能性大小;最后,结合字符能量和链接能量定义文本能量,来表征候选文本模型是真实文本概率大小,并通过设定文本能量的阈值来获取最终符合条件的文本目标位置。除此之外,为了使本文方法更有效的获取文本目标的位置信息,提出了一些预处理方法:利用保留非连续性平滑的方法来抑制自然场景中的噪声和部分细小杂质背景;通过彩色图像边缘检测获取尽可能多的文本边缘信息;提出的闭合边缘检测算子则是为了满足基于图结构的文本定位模型三大基础特征获取的条件。在文章的最后,对比了本文提出的算法和其他算法在定位效果上的优劣,提出了本算法的不足以及未来的期望。
其他文献
微生物发酵是生物工程和现代生物技术及其产业化的基础。发酵过程的控制和优化直接影响着发酵的产量和质量。发酵过程涉及生命体的生长繁殖,机理复杂,具有时变、非线性等特点
随着国际贸易的不断发展和扩大,集装箱运输在现代物流体系的重要地位日益凸显,运输方式以海运为主。然而在长时间的运输过程中,货物损坏事件频频发生,亟需解决集装箱及货物的
深海机器人是整个深海作业系统的关键组成部分,而深海机器人故障诊断系统对于保证其海底正常作业至关重要。深海机器人是一个复杂的大系统,传统的故障诊断方法一般都需要对诊
学位
管道输送已成为与铁路、公路、航空、水运并行的五大运输手段之一。由于管道设备老化、地理和气候条件的影响以及人为破坏等原因造成管道泄漏事故时有发生,因此迫切需要对管
质子交换膜燃料电池(Proton Exchange Membrane Fuel Cell,PEMFC)具有无腐蚀、操作温度低和启动快等特点,有着光明的应用前景。实际工作中,PEMFC输出性能并不稳定,需实时对操作条件进行调节以优化电堆输出性能,因此本文探究了燃料电池操作条件对输出性能的影响规律,针对PEMFC输出性能检测与优化问题作了深入研究。首先,结合当前PEMFC国内外研究现状,提出了一种新方
随着计算机技术和网络技术的高速发展,网络化制造已经发展成集计算机网络、自动化控制、先进制造和现代管理为一体的生产模式,通过统一的制造平台,在智能算法的支撑下,实现制
由于复杂仿真系统中存在多种、大量的不确定性,使得仿真实验的复杂性增加,因此本文通过研究已有仿真实验方法,针对复杂仿真系统含有不确定性的情况,以减少实验次数、提高仿真
随着传感器等领域的技术发展,智能机器人在服务行业中的应用越来越广泛,并受到企业界和商业界的重视。本论文以国家863高技术项目《助老/助残机器人关键技术研究》的子课题《实
序列图像的超分辨率重建技术是指对同一景物进行带有亚像素位移的多次拍摄,利用图像之间的互补信息重建出一幅空间分辨率大大提高的图像的过程。图像超分辨率重建对于提高图