基于空间映射策略的文本行分割方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:liongliong580
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在社会发展的过程中,文字作为信息记录工具发挥了重要的作用,伴随着时代的发展,对信息的管理利用提出了更多的要求。大量的手写文档数据以文档图像的形式保存,但是单纯的对文档拍照保存是非常低效的管理模式,为了更方便的利用管理文档信息,需要建立文档图像的转录,索引和检索系统,而在这些系统中文本行分割仍然是最重要的初步任务之一。在文本行分割任务中,由于处理的图像数据为扫描所得,因而往往文本特征较差,其中文字字体各异、书写风格不一、尺寸不同且行间分布密集,在某些历史文献中同时伴有插画、污渍等因素的干扰。随着深度学习方法的发展,在图像处理的大部分领域都超越之前的传统图像处理方法,取得了突出的进步。借助神经网络强大的拟合能力,能够通过特殊的设计策略使得模型产生具有特定分布规律的映射关系,因此在这里本文提出了基于空间映射策略的文本行分割算法,并对比研究了不同的映射策略对整个算法的设计及性能造成的影响。本文的主要研究任务如下:首先,在空间映射这一基本方法之下,本文设计了两种基于不同映射策略的文本行分割算法。其中在高维空间映射策略中,借助度量学习的方式,本文通过将图像映射到能够区分相邻文本行的高维空间中实现文本行分割任务。而在低维空间映射策略中,本文通过方向向量场关联文本区域中各个位置与其相关的文本中心线,以此达到文本行分割目的。其次,本文针对两种不同的空间映射策略的文本行分割算法,分别提出了相应的算法改进策略,并通过消融实验的方式证明了改进策略的有效性。在基于高维空间映射策略的文本行分割算法中,本文设计了一种多中心的度量学习策略来改善模型学习到的高维空间分布,以此来提高算法的性能。而在基于低维空间映射策略的文本行分割算法中,本文设计了一种自校正过程用以改进模型预测的方向向量场的质量,进而提高整个算法的性能。最后,借助对比实验,本文在两个公开数据集上比较了现有的文本行分割算法与本文提出算法的性能差异。实验结果表明在文本行分割问题中,基于低维空间映射的策略的文本行分割算法性能要明显好于基于高维空间映射策略的文本行分割算法。即使与现有的文本行分割算法相比,本文提出算法同样取得了有竞争力的性能提升。
其他文献
低温等离子体(NTP,Non-thermal Plasma)因含较多活性自由基被广泛应用于污染物处理各个领域,具有处理效果好、无二次污染的特点。柴油机微粒捕集器(DPF,Diesel Particulate Filter)可有效过滤柴油机尾气中的碳烟颗粒,但DPF滤芯中的碳烟颗粒需定期清除。利用低温等离子体中的氧活性自由基可在较低温度下氧化DPF中的沉积碳烟颗粒,实现DPF再生。现有研究大多关注外
线性调频连续波(LFMCW)体制的雷达因其体积小、测距和测速精度高、无测距盲区、成本低在目标有源探测领域得到广泛应用。近年来,随着低空领域的开放,以无人机为代表的“低慢小”飞行器市场进入飞速发展期,对无人机的有效监视与管控成为亟待解决的难题。本文采用LFMCW体制雷达方案对无人机目标进行探测,重点针对多普勒处理与杂波抑制、恒虚警检测等关键信号处理算法进行理论研究与仿真分析,并基于以FPGA为核心的
目的 1.研究年龄因素对脂肪祖细胞的增殖能力及其外泌体生物学特性的影响(例如外泌体形态,粒径分布,表面标志物等);2.APC-exo(Adipose progenitor cell-derived exosomes)抗皮肤成纤维细胞衰老的效果研究及其机制探讨;3.比较研究年龄因素的影响:对比不同年龄组来源APC-exo抗皮肤生纤维细胞衰老的效果。方法 本研究共纳入年轻以及年老男性皮下脂肪17例(其
随着互联网+的理念的提出,越来越多的行业加入互联网,建筑行业也不例外。建筑信息数字化已经发展了很多年,将这些数字化的建筑信息放在互联网上,便于人们随时随地的浏览、使用。但是随着建筑信息的数据量猛增,展示渲染模型的难度也随之增加。如何将这些数据轻量化、并将其流畅地渲染成为一个重要的课题。基于Web的BIM大模型轻量化渲染优化研究主要分为两个部分:对模型数据轻量化研究和对基于Web的渲染优化研究。对于
构建面向学生学科素养发展的学习过程评价指标体系能够帮助教师科学、客观地评析学生的学科学习过程,并通过"以学定教""以评促教"优化和改进教学过程,从而发展和提高学生的学科素养。通过文献梳理、理论演绎等方法建构面向学生学科素养发展的学习过程评价指标体系,通过德尔菲法修正指标体系,借助问卷调查法验证指标体系的信度和效度,最后得出面向学生学科素养发展的学习过程评价指标体系包括条件要素"学习的基础"、过程要
在移动互联网与人工智能不断发展的今天,用户使用互联网产品时的行为和习惯信息对于系统开发者来说至关重要。通过对应用进行不同方式和程度的代码埋点可以有效地采集到用户的浏览、操作和访问记录,再经过后续进一步的量化处理,分析用户的交互行为,从而帮助开发者对系统进行持续优化设计。在移动端,传统的代码埋点存在着对业务代码侵入过多、开发成本较大等缺点。于是,无痕埋点技术应运而生。本文通过运用字节码注入技术实现了
在如今互联网飞速发展、日新月异的时代,人们的生活与互联网逐渐密不可分。大型的互联网网站往往用户数众多,每秒都会有数以亿计的数据被发送与接收,传统的C/S架构往往无法承受如此之大的数据与并发量,中间件技术就此应运而生。但在生产环境中,分布式中间件集群往往会因为各种原因出现问题,很难保证中间件系统的绝对可用性。因此服务提供方需要对各类中间件服务进行统一管理,搭建统一运维监控平台。系统提供配套的监控设置
工会作为职工的"娘家人",在新冠肺炎疫情背景下,严格贯彻执行关于疫情防控的指示和精神,凝聚职工力量,带领职工战胜困难,为打赢疫情防控战役提供了支撑,发挥着积极的作用。本文对新冠肺炎疫情下做好思政工作的意义进行了阐述,并分析了实际问题,最后提出了具体措施,希望对常态化形势下,疫情防控工作有所启发。医院作为抗疫的"前线阵地",在疫情防控中占有关键的地位。
期刊
受Philipp于1967年解决的β-动力系统下的逼近问题的启发,本文主要对Rd上若干有限制的丢番图逼近问题进行讨论,得到了Rd上若干上极限集关于Lebesgue测度和Hausdorff测度的结论.我们在第一章介绍了本文的背景,在第二章给出了必要的预备知识,之后用了两章内容分别对Rd上限制集的单逼近函数的非齐次逼近问题和限制集的多逼近函数的齐次逼近问题进行了讨论.在第三章中,我们证明了对于给定的逼
在自然界中,很多动力学系统不仅依赖于当前状态,并且依赖于过去的历史,为了更好地描述客观世界,随机时滞微分方程的研究一直备受关注.本文主要讨论了一类高阶非线性随机时滞微分方程dx(t)=ax(t)+bxα1(t)xβ1(t-τ)+cxα(t)dt+mxα2(t)xβ2(t-τ)dw(t).在该方程存在全局唯一解的基础上,本文给出了保证该解矩有界以及稳定性的充分条件.由于非线性随机微分方程的解析解一般