基于多通道MSER的场景英文文本检测及识别方法研究与实践

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:aie520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景中的文本信息能够更利于人们对图像进行理解,同时如何检测和识别场景中的文本也已经成为热门的研究领域。一个完整的场景文本检测和识别方案一般包括三个步骤,首先需要进行文本检测,然后再进行文本筛选,最后才是文本识别。现有的方法存在以下的不足之处:(1)最大稳定极值区域(MSER)算法是主流的场景文本检测方法,但它只考虑了图像的灰度空间,没有充分利用其他颜色信息。(2)对于非文本筛选,现有方法大多是基于神经网络,但是常规的神经网络必须要求输入的图片具有统一的尺寸,导致不能直接处理由MSER算法产生的不规则区域。(3)现有的文本识别方法一般是针对单个字母进行识别,没有考虑单词内字母的关联关系。针对以上问题,本文进行了如下研究:(1)增强的多通道最大稳定极值区域模型(Multi-channels MSER)。在对图片进行MSER提取之前,先对图片进行锐化和模糊处理,然后在传统的MSER算法基础上,对图像提取多个通道(R,G,B,H,S,I,Grey),从不同的颜色模型中提取多个维度的信息,然后把结果整合,使得MSER能够检测出模糊和不同字体的文本。实验表明,该方法能够检测出更多的场景文本,平均的f指标提高1%。(2)并行的空间金字塔卷积神经网络分类器(SPP-CNN)。对于非文本MSER,本文提出的分类器模型有两个主要的改进,首先在传统的CNN基础上,加入了空间金字塔池化(SPP),使得神经网络可以处理任意尺寸的图片而且可以提高分类效果。其次,将人工设定的特征融入CNN网络中,形成并行的分类器,这样能够更好对非文本MSER进行过滤,使得检测的精度大大提高。(3)基于循环神经网络(RNN)的场景文本识别模型。在对文本进行识别时,把待检测的单词区域作为序列数据,采用RNN对单词序列进行预测。为了更好的处理较长序列在RNN训练过程中出现的梯度消失问题,本文采用了长短时记忆网络(LSTM)对RNN的内部循环结构进行了替换。最终实验表明场景英文文本的识别率平均提高5%。
其他文献
目前,基于时间序列的突变理论及检测方法体系已经进行了深入研究,已经取得了大量有用的结果,形成了许多有效的突变检测技术。然而,这些研究未能顾及地理空间变量,割裂了地理变量的时空关联。由于多数地理变量是一个非线性、非平稳的时空对象,隐含了许多地理现象及地理变化的动力学机制。因此,进一步完善空间突变理论体系、发展地理空间变量突变检测方法,对挖掘系统突变中隐含的地理信息以及推动地统计学的发展,具有十分重要
在三维基因组领域,Hi-C技术在研究全基因组交互中扮演关键角色。随着技术的进步,传统Hi-C实验中的数据利用率低,实验周期长,实验成本高等问题逐渐显露。为了弥补这一不足,2018年5月份Nature Genetics发表了一篇关于新的Hi-C技术DLO Hi-C(Digestion-ligation-only Hi-C)。相比于传统Hi-C技术,DLO Hi-C有着测序数据质量高,实验周期短,可重
在过去的几十年里,人们对提高学术论文中知识主张的可靠性和说服力的兴趣日益浓厚。研究发现,学术论文作者普遍使用元话语与其目标读者建立互动,引导读者关注其研究,参与其讨
地区公共产品承载了丰富的内涵,为国际关系研究地区合作议题打开了一扇门。本文围绕地区公共产品供给模式如何生成这一核心理论问题,梳理了公共产品论和国际关系论的相关理论
背景:先天性心脏病是一种由环境因素与遗传因素共同参与的疾病,越来越多的基因及信号通路被发现在先天性心脏病的发病过程中起作用。NODAL是Nodal信号转导通路的主要配体,在
在多标签问题中,一个实例不仅与多个标签有关,而且常包含高维特征。在这些特征中有些是冗余的甚至是不相关的,它们的存在降低分类器性能,增加内存占用量。多标签特征选择技术由于能够挑选出与标签最相关的原始特征而成为最主流的解决上述问题的方法。本文在基于条件互信息的非线性规划形式特征子集选择框架QIPcmi的基础上提出两个多标签特征选择算法:(1)基于条件互信息联合遗传算法的多标签特征选择算法;(2)基于归
利用多孔材料吸附并去除有机污染物是处理污水中有机污染物的重要手段。新型纳米多孔有机材料由刚性结构单体通过共价键构筑,具有比表面积大、密度小、理化性质稳定、易于化学后修饰等优点,是污水处理的吸附剂。三嗪基共价微孔有机聚合物(CTPs)由缺电子的三嗪基团和富电子的苯环基团交替排列组成,其丰富的识别位点和良好的多孔性使其能够有效吸附在水中有机污染物。本文结合磁性吸附技术,将三嗪-三苯胺基微孔有机聚合物(
肝癌是全球癌症相关的第四大致死疾病,其发病率持续上升。大量文献研究表明:果糖1,6-二磷酸醛缩酶A(ALDOA)在诸多癌症中过表达,尤其在肝癌中表达升高明显,且ALDOA的高表达与肝
目的:分析影响早期复发性流产患者安胎结局的相关因素,结合安胎治疗时机及疗程分析不同的切入时机对安胎结局是否有影响,以寻找最佳的切入时机,减轻或消除相关因素对安胎结局
互联网与信息技术的飞速发展使得复杂多样的信息充斥着整个网络,这造成了信息过载的问题。因此,利用用户的信息主动向用户推荐可能感兴趣项目的个性化推荐系统被广泛应用在各