【摘 要】
:
手写文本(字符串)识别方法是将手写文本转化为电子文本的技术。近年来随着计算机技术的发展和深度学习方法的兴起,涌现出多种字符串识别方法。它们按照对输入图片的切分思路可以分为两类:基于显式切分(也叫过切分策略方法,over-segmentation)的字符串识别方法和基于隐式切分(也叫无切分策略方法,segmentation-free)的字符串识别方法,两种方法其各有优缺点。本文拟融合两种方法,利用这
论文部分内容阅读
手写文本(字符串)识别方法是将手写文本转化为电子文本的技术。近年来随着计算机技术的发展和深度学习方法的兴起,涌现出多种字符串识别方法。它们按照对输入图片的切分思路可以分为两类:基于显式切分(也叫过切分策略方法,over-segmentation)的字符串识别方法和基于隐式切分(也叫无切分策略方法,segmentation-free)的字符串识别方法,两种方法其各有优缺点。本文拟融合两种方法,利用这两种识别方法各自的优势,取长补短。在参考了其他领域的系统融合技术后,本文在字符串识别领域首次提出基于注意力的神经网络融合模型。其具体方法是将两种中文手写文本识别方法对同一张图片的识别结果送入融合模型中,模型通过卷积神经网络提取特征,然后通过注意力机制将多个输入组合起来获得最终的融合结果。不同于传统的融合模型方法,本文不使用循环神经网络(Recurrent Neural Network,RNN)结构,而改用可以并行计算的全卷积的序列到序列(sequence to sequence,seq2seq)结构。并且为了实现在全卷积情况下的多对一的注意力方法,设计了多种注意力融合实现方法。本文还提出了一种新的融合模型训练方法,在上述的两种中文手写文本识别方式的训练集上直接融合,这样就不会使用额外的数据,这种融合模型训练方式会使得实验对比更加公平。实验部分首先分析了不同模型结构对融合效果的影响,确定了最优的融合模型结构,也证明了本文提出的使用联合自注意力机制的全卷积融合模型优于传统RNN结构的融合模型。然后通过关于语义信息的对比实验用以探究融合方法提升的原因,发现融合方法效果提升依赖于训练集中的语义信息,指出融合模型的主要作用为纠正识别结果中的语义错误。除此之外还设计了参与模型全为基于隐式切分方法的字符串识别模型的融合实验,证明了两种切分方法的字符串识别方法的有效互补性。实验部分证明了对基于显式切分和基于隐式切分两种字符串识别方法进行融合思路的可行性和有效性,但也揭露了融合模型对于语义信息的依赖性这一缺陷。在文章最后,针对这一缺陷提出了多种后续工作改进思路。
其他文献
油田智能化是未来石油行业发展的趋势,人工智能技术的进步为各行各业的产业升级带来了新希望。油气集输系统是整个石油地面工程的核心部分,传统的油气集输系统控制依赖于人工PID参数整定和精细化管理,生产流程需要人工检测数据以及手动调整控制参数,操作难度大、存在安全隐患且不具备普适性,同时在油气输送过程中易造成较高能耗、低资源利用率,使得生产成本的陡然上升。因此,本文针对以上问题,提出一种基于强化学习的油气
由于地层的复杂性和隐蔽性,当今钻井作业严重依赖于井上、井下的双向信号传输,以及人类专家的经验决策。然而,针对深井、超深井等复杂井况,高质量的实时信号传输难以实现,且依据理论建立的岩石力学模型不足以支撑实时钻井决策。因此,本文提出了一种基于深度学习的智能导钻方法,有望为地质导向的实时决策提供一种新思路。本文的主要工作包括:(1)提出一种基于特征选择和广角眼机制的感知增强方法。该方法能够提高测井数据质
初至表示地震波最先到达检波器的时刻,是地震资料的一种重要信息。近年来,随着勘探任务的复杂化和勘探规模的扩大化,初至拾取工作面临着很多新的挑战。其中,主要有地震记录的缺道和低信噪比的问题。为此,往往需要引入额外的处理环节,例如插值或者去噪等。这些环节不仅增加了人力物力的消耗,同时也影响着初至拾取结果的准确性。全卷积神经网络是一种被广泛应用于图像、语音领域的深度学习工具。其强大的数据信息挖掘能力和表征
对油田岩心数据进行分析能够帮助人们更好地开发油田,提高油田采收率。随着油气勘探领域技术的不断提高,在油田开发过程中产生的数据呈指数型增长,传统的岩心数据分析方法并不能高效地分析海量的油田生产数据,无法发掘出其中潜在的信息。随着数据挖掘技术在石油领域中的普及,使得通过大数据分析技术对岩心数据进行数据挖掘成为了一项有价值的研究。本文介绍了数据挖掘技术在国内外石油领域中的研究现状,分析了目前将数据挖掘技
火力发电等工业控制领域一直致力于研究历史数据中蕴含的有价值的控制规律,以指导设备运行优化,提高经济效益。但由于工业控制系统组成复杂、参数耦合性较强,针对此类大规模复杂多元的时序控制数据的分析需要结合领域知识进行大量渐进式探索尝试。可视分析技术能够提供灵活的视图交互以支持复杂的数据迭代分析过程,目前已成为此类迭代分析问题的高效探索方法之一。随着对工业控制数据可视分析研究的深入,需要分析的控制过程和参
照相机和光谱仪的功能广为人知。成像光谱仪就是结合了两者的功能,空间信合和光谱信息都可以通过成像光谱仪获得。由于这种性能,成像光谱仪的运用范围非常大。在本篇论文中,主要讨论的是DMD编码成像光谱仪算法的研究,论文的主要安排如下:1.成像光谱仪以及成像光谱仪的分类、应用和研究现状。引出了编码成像光谱仪。DMD编码成像光谱仪是其中一种方式,并简述了其优点。2.数字微镜DMD是编码成像系统的一个重要器件。
LNG接收站的红外热成像监测具有关键设施体积大、场地情况复杂等特点,对红外热成像的数据清洗、异常识别与定位等提出了更高的要求。针对红外热成像监测技术在LNG接收站应用过程中易出现的问题,本文从异常数据清洗、异常监测及识别、异常区域定位及预警三个方面展开研究,提出相应的解决方案,并根据案例分析结果验证了该方法的可行性和有效性:(1)针对监测过程中异物通过镜头前方引发误报警的问题,提出了基于HOG+S
在油气生产过程中,其原材料大多具有易燃、易爆、有毒的性质,同时因为生产过程连续性强、技术复杂、设备繁多等特性,一旦发生事故,不仅会导致人员伤亡和财产损失,同时也会产生巨大的社会影响,甚至会危害到社会公众安全,产生难以想象的经济损失和无法挽救的后果。本文针对油气生产工艺操作过程中可能存在的操作行为失误,建立工艺模拟操作平台,利用视线追踪技术对操作者的异常认知行为进行监控,将眼动数据和眼动热点图像等特
新时期背景下,智能技术的广泛普及,为机械制造行业进一步发展提供了强大的技术支撑,促进机械制造技术愈加成熟,在一定程度上提高了社会生产水平,为国家经济建设奠定了良好基础。基于此,本文将针对新时代背景下我国机械制造与智能制造现状进行分析,深入探索机械智能制造的特点和意义,并对机械智能制造技术展开研究,希望能够为专业人士提供参考、借鉴。
对学生学业进展及影响因素进行可视化与分析有助于优化课程结构和师资配置,改进专业课程教与学的过程,提升大学各专业的教学质量。然而,长时间跨度的离散化学生成绩数据难以直接展现学生学业进展;学生成绩又具有高维多元、时序相关等数据特征,且易受学生自身、课程结构和教师等多因素影响,对分析过程带来挑战。为此,本文面向专业教学的学业进展分析进行可视化与交互设计研究,并开发了可视分析原型系统——APVAS,支持从