自然场景图像中文本检测技术研究

来源 :北京科技大学 | 被引量 : 7次 | 上传用户：holy1987

【摘要】

：

自然场景图像中的文本信息可以传达丰富而准确的高层语义信息,是理解场景内容的关键元素。随着图像和视频的数量呈现出快速的增长,自然场景图像中的文本检测技术得到了国内外

【作者】

：

郑阳

【出处】

：

北京科技大学

【发表日期】

：

2018年01期

【关键词】

：

笔画宽度颜色极值区域文本熵卷积神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

自然场景图像中的文本信息可以传达丰富而准确的高层语义信息,是理解场景内容的关键元素。随着图像和视频的数量呈现出快速的增长,自然场景图像中的文本检测技术得到了国内外研究人员的广泛关注。然而,自然场景图像中的文本检测具有相当大的挑战。一方面,自然场景中的文本具有不同的字体、大小、方向和颜色,甚至属于不同的语言。另一方面,自然场景中复杂的背景,以及噪声、模糊、曝光和遮挡等因素,给文本检测带来了很大的困难。因此自然场景中的文本检测仍然存在着许多技术难点。针对场景字符的多变性以及背景的复杂性,本文借鉴图像处理、目标检测、模式分类、机器学习等领域的最新进展,重点研究自然场景图像中文本检测相关的基本问题。具体而言,本文主要从以下几个方面展开研究:1)自然场景图像中光照不均匀、字符的扭曲、遮挡以及边缘检测算法的选择等因素,影响了以笔画宽度为基础的文本检测算法的性能,导致了字符检测结果中部分字符笔画缺失,甚至造成了字符的错检、漏检。针对字符笔画缺失、错检和漏检的问题,提出了一种基于笔画和颜色融合的文本检测算法。在字符提取过程中,以笔画连通域为基础,利用笔画的颜色信息对笔画连通域进行扩展,解决了字符笔画缺失和错检的问题。对于漏检字符的提取,以字符连通域为基础,利用相邻字符几何特征和颜色一致性原理对漏检字符检测,解决了字符检测过程中漏检的问题。通过对算法的每一个过程进行实验对比,证明了笔画和颜色融合的文本检测算法有效地弥补了基于笔画宽度检测算法的不足。2)自然场景图像中模糊和低对比度文本与背景难以区分,有效的文本特征很难被正确地提取。针对模糊和低对比度文本难以检测的问题,提出了一种基于极值区域的文本检测算法。该算法首先利用极值区域在图像的多个通道中对字符连通域提取,然后通过非字符连通域过滤、字符连通域召回等方法获得文本字符。最后结合文本行中字符的数量和类别提出了文本熵的概念,利用文本熵和卷积神经网络模型共同对文本候选区域的稳定性进行判断。通过实验证明了基于极值区域的文本检测算法解决了模糊和低对比度文本难以检测的问题。3)自然场景图像中背景的复杂性导致字符检测召回率较低进而影响了文本检测的性能,同时大多数检测算法对于检测任意方向的文本存在着一定的难度。针对复杂背景中字符检测较差以及任意方向文本检测较难的问题,提出了一种基于卷积神经网络的文本检测算法。算法以文本词语作为检测单元,避免了字符检测结果对文本检测性能的影响。同时根据词语几何特征对区域建议网络的尺度和比例大小重新设置。为了获得文本区域较强分辨能力的文本特征,融合了卷积神经网络不同卷积层之间的局部特征和全局特征。在候选区域进行类别判断和位置回归的多任务过程中加入文本的角度信息,使得模型具有预测文本几何坐标和角度的能力。最后利用基于蒙特卡洛的非极大值抑制方法,排除冗余的检测结果。通过实验证明了基于卷积神经网络的文本检测算法实现了对复杂环境中任意方向文本的检测。

其他文献

甘肃瑞泰保健品市场营销策略研究

随着中国经济社会发展和医疗保健品制度的改革不断深入,保健品市场越来越繁荣。无论国内外品牌,都需要保健品企业改变营销策略,提升自己的市场竞争优势,创立独特的品牌特色。

学位

甘肃瑞泰保健品营销策略

高考图文转换题综述

<正>图文转换题是指用语言文字对图表资料等信息进行转述的一类试题。它要求考生具备较强的理性思考能力和语言综合表达能力。近三年来图文转换题越来越为命题者所重视。但从

期刊

图文转换

浸出车间正确操作对降低溶剂消耗的重要性

简单介绍了浸出车间溶剂消耗的原因，分析了操作维修不当引起溶剂消耗增大和“跑、冒、滴、漏”增加的原因，找到了通过提高操作水平降低溶剂消耗的措施。

期刊

溶剂消耗浸出操作

“整体复建”重创后的古城复兴路径探索——以大同古城为例

近年来,我国数十个大大小小的名城开展了"重建古城"的运动,在全国引起了广泛的关注。2013年以后,在多种因素的共同影响下,这股重建风潮受到了部分遏制,但由此带来的诸多弊病

期刊

整体复建拆旧建新网络修补真实性本土化

品牌经营与党报核心竞争力研究

党报是我国报业发展的核心力量,在传媒市场激烈的竞争环境下,党报要想实现更长远的发展,就要在整合资源的基础上,加大品牌建设力度。本文从改变党报经营理念、制定品牌营销策

期刊

品牌经营党报核心竞争力提升

小学语文教师专业素养的研究

小学语文教师的专业素养是我们新课程教学改革所提倡的内容,语文教学改革对教师提出了新的要求和素养,小学语文教学对教师新的教学素养结构模式提出了新的要求,主要是针对现

期刊

小学语文教师专业素养研究

基于宣传营销目的的企业信息发布材料翻译

基于宣传营销目的的企业信息发布材料是译者在翻译实践的过程中最常接触的文本之一。这类材料具有以下三个特点:句型简单,多用疑问句与祈使句;多用修饰成分;带有鲜明的企业自

学位

企业信息发布材料翻译方法宣传营销文本特点

墨滴视觉检测系统关键技术研究

喷墨打印在票据、标签、包装等方面应用广泛,近年来逐渐扩展到服装、印刷电路板(PCB)制造、文化创意产业等先进的高端领域。相比于传统的制备方法,喷墨打印具有图案化能力强

学位

墨滴检测运动目标背景减除图像分割

反避税的国际合作及发展趋势

国际金融危机以来,各国政府越来越重视跨国公司的国际避税问题,加强了反避税的国际合作。本文回顾了反避税国际合作的历史、避税与反避税的现状和反避税国际合作的发展趋势,

期刊

反避税国际合作趋势

结合国际经典案例探讨“受益所有人”认定问题

"受益所有人"的概念最早起源于英美法系,在上世纪70年代,被OECD引入了税收协定范本,并逐渐发展成为一种防止跨国企业滥用税收协定、套取税收利益的反避税机制。然而,长期以来

期刊

受益所有人经济实质实质重于形式

自然场景图像中文本检测技术研究

其他学术论文