阅读模式下的文本检测算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:gaoruizhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本检测是计算机视觉中的一个重要分支。随着近年来互联网的快速发展,作为信息的主要载体之一的文字呈现出多样性、海量性、动态增长性等特点,网络上每日新增数百亿文字信息。如何从这些海量的文字信息中提取出自己感兴趣的部分已成为巨大挑战,这涉及到文本检测技术。传统的文本检测算法需要手工设计特征,并采取多个复杂步骤才能完成检测任务。受限于文本检测任务自身的复杂性,目前的文本检测算法检测性能仍然不够鲁棒。因此文本检测算法仍有巨大的提升空间,继续对该课题进行深入研究具有重要学术意义和应用前景。本文主要研究内容如下:1.本文首先定义阅读模式,确定阅读模式的应用场景,分析数据图像特点,完成图像收集、标注、扩展等工作,并将该数据集与现有公开数据集进行统计分析对比;2.文本研究了一种基于上下文信息的文本检测算法。根据本文第二章数据集统计分析发现本文数据集图像中不同文本行对象之间存在一定的空间关系,而单个文本行内部文字间存在一定逻辑关系。根据上述文本分布特点,本文设计上下文信息提取结构,通过双向长短记忆网络提取文字之间的逻辑特征,通过放大特征谱并进行全局池化、反池化等操作提取空间特征,最终完成基于上下文信息的文本检测算法研究;3.本文研究了一种基于特征融合的多方向文本检测算法。针对多尺度文本检测算法中浅层特征空间细节信息丰富、语义信息不足,深层特征语义信息丰富、位置信息损失严重的问题,本文设计了一种特征谱权重学习结构。该结构将多尺度特征谱与相应权重相结合,构建特征金字塔,得到表达能力更加鲁棒的特征谱,完成基于特征融合的多方向文本检测算法研究;4.本文研究了一种基于聚类的文本检测算法。上述研究算法均为基于候选框的文本检测算法,对于不规则文本对象,这类算法无法得到鲁棒的检测结果。鉴于上述方法的缺点,本文将图像的每个像素均视为可分类样本,同时确定样本类别总数,固定每类聚类中心,设计聚类损失函数,通过卷积神经网络学习每个样本的特征向量,并根据特征向量与聚类中心完成聚类,将样本进行分类,得到文本连通域,最终通过后处理实现文本定位,完成基于聚类的文本检测算法研究。本文在新构建的阅读模式下的中文文本检测数据集上对以上前两个工作进行实验验证,测试结果表明本文的文本检测算法能够有效提高检测性能,同时在公开数据集CTW1500上对第三个工作进行实验验证,最终实验结果表明该方法能够有效提升不规则形状文本的检测性能。
其他文献
手性有机小分子催化在不对称合成中有着广泛的应用,是继生物催化体系(如酶催化),金属有机配合物手性催化剂之后第三类用途广泛的手性催化剂。苯并[e]-[1,2,3]恶噻嗪2,2-二氧
众包旨在利用大众智慧解决单凭机器难以处理的问题。近年来,众包研究者提出复杂任务的概念,这类任务往往是多技能需求的,具有复杂的计算操作,单个众包工人无法完成。复杂任务
基于物理的渲染技术被广泛运用于照片级真实图像的合成。通过提供合成的逼真图像,基于物理的渲染对相关领域产生了巨大的影响,比如电影娱乐、增强现实、家装设计等领域;除此之外,通过为深度学习等对数据需求较大的方法提供大量合成数据集,基于物理的渲染技术对学术研究也产生了巨大贡献。然而,基于物理的渲染很大程度上依赖于光线追踪技术,因此对于复杂场景往往需要进行大量的计算且难以并行。在这篇论文中,我们提出一种端到
在函数型数据分析(Functional Data Analysis,FDA)领域中,函数型单指标模型(Functional Single Index Model,FSIM)是目前统计学术界研究者的讨论热点。在FDA中,函数型数据的
基于超构材料的高灵敏折射率生物传感器一直是当前研究的热点。本论文通过研究超构材料中磁表面等离激元共振的调控和三维光学超构材料中磁表面等离激元共振的增强效应,获得了具有高性能的生物传感器,并有望将其推广到无标识生物医学领域。论文首先介绍了表面等离激元的基本性质、特点及其在生物传感器、表面等离激元激光器等方面的相关应用。接着通过对该领域进一步的探索,介绍了超构材料的基本知识以及磁表面等离激元的特点和相
纵观世界,市场竞争愈发激烈,企业要想在竞争中生存发展,只有通过创新塑造核心竞争力。目前在我国经济新常态的宏观环境下,我国企业面临着更为残酷的竞争环境,只有不断推动创新才能持续发展。高层阶梯管理理论认为高管人员的认知偏好、价值观、风险偏好等一定程度上可以通过高管特征得以显示。CEO作为企业高管团队的核心成员,对于企业战略的制定与实施具有举足轻重的作用。本文从CEO得职业背景定义CEO一般管理能力,考
MAX相材料具有优异的高温抗氧化性能,较好的高温摩擦学性能,是潜在的高温结构/润滑材料。但MAX相材料的硬度与强度较低,同时在高温摩擦条件下,其摩擦表面形成的摩擦氧化膜以M
随着人类社会的发展,“唯GDP论”被全球各界所摈弃。衡量人类发展的指标开始关注人的全面发展。最具影响力的人类发展指标就是1990年联合国开发计划署(UNDP)研制并发布的人类
视觉系统是人类获取外界信息的主要途径。据统计,大约有80%的外界信息是通过眼睛被人接收的,然而,人类的视觉在各种领域受到了很大的限制。随着计算机技术的飞速发展,让计算机来处理人类视觉信息,推动了计算机视觉这一学科的产生与发展。目标跟踪作为计算机视觉的一个重要分支,在视频监控、智能交通、人机交互和虚拟现实等领域有着广泛的应用。近些年,提出了很多种目标跟踪算法,但是在实际跟踪过程中,当目标遇到形变、光
降雨作为气象水文循环中重要的一部分,近年因受全球气候变化影响而发生了一些改变。降雨的时空分布制约着一个地区的社会经济发展,并且对该地区的防洪抗旱以及水资源的有效运