基于隐马尔可夫模型的文本识别纠错技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:isgongping
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网时代的到来,各种信息的数字化在人们的生活中随处可见。比如之前学生上课大多采用纸质书籍作为信息承载媒介,而近年来课件、PPT等电子授课工具越来越流行。甚至出于成本的考虑,电子化书籍也在学生中颇受欢迎。但是与此同时也带来了一系列的问题,比如电子化书籍中的PDF或者图片中的文字无法像文档一样直接编辑,为信息查找、修改或者统计录入带来了诸多不便。针对这些问题,本文提出了一个基于隐马尔可夫模型的文本识别纠错系统,其主要研究内容如下:基于投影轮廓融合的版面分析模型。本文的识别对象为文档图片中的文本区域,需要通过版面分析对图片、公式和表格等非文本区域进行分割。本文分别采用投影分析和轮廓检测的方法定位出非文本区域,其中投影方法是利用非文本区域的投影特征与字符相差较大,而轮廓方法是利用非文本区域的轮廓特征和字符的区别,最后将两者的结果融合分析得到最佳文本区域。实验结果表明融合方法可以较好地实现非文本区域的分割,为之后针对文本行图片的识别纠错做铺垫。基于深度学习的文本识别模型。传统的文本识别方法需要定位出每个字符的位置区域,然后再对其进行分类识别。这种方法的识别效果依赖于字符的分割效果,但是由于中文字符自身的特点,字符分割本身就是一个很难处理的问题。本文采用Dense Net+Bi LSTM+CTC的深度学习框架作为文本识别模型,其在识别过程中根据文本图像的特征自动完成了字符的分割识别,有效避免了人工进行字符分割这个环节。实验证明本文采用的深度学习模型有效完成了文本识别任务。基于隐马尔可夫的文本纠错模型。文本识别的结果并不能保证100%的正确率,需要通过文本纠错进一步提升其识别率。本文以OCR的识别结果为观测状态,以对应的正确字符为隐藏状态,将其建模成隐马尔可夫模型。将文本纠错问题转化为在给定的识别结果序列情况下求最可能的正确字符序列的问题,效果上将识别率提升为99.02%。综上所述,本文通过版面分析和文本识别初步提取出文档图片的字符,然后基于隐马尔可夫模型进一步纠正字符中的错误,完成了文档图片的信息提取。
其他文献
感知技术在交通、军事、农业等领域具备极其重要的使用价值,且在低时延、大容量、高速率的情境下,越来越多的应用场景对环境感知提出越来越高的要求。在感知层面中,目标的检测和跟踪具有举足轻重的地位,其相关的技术成果已渗透到人们生活的方方面面。而当探测环境比较复杂时,使用传统的感知手段和方法来完成目标的检测与跟踪从过程上分析比较复杂,且由于目标具有一定的空间结构,以往的处理方法经常忽略目标的多散射点模型,因
信号的检测与识别被广泛应用于频谱监测、军事电子对抗、信号解密、干扰探测等领域。随着通信环境的日益复杂,传统的单信号识别技术无法应用于电磁干扰严重的信号混叠场景。如何消除干扰、频偏、相偏、衰落等带来的影响,识别出混叠信号中的未知信号源是一个亟待解决的难题。传统的盲信号识别算法识别精度依赖于盲源分离效果,然而复杂通信环境下的非充分稀疏混合信号难以分离,且无法适应环境的动态变化。本文围绕基于机器学习的盲
现代社会亟需新一代的移动通信技术,以满足用户对低时延、广覆盖、高速率的需求。与常用的半双工相比,全双工提高了日渐稀缺的频谱资源的利用率,近年来得到了广泛研究。然而由于全双工在自干扰消除能力不佳时性能不及半双工,混合双工,即全双工和半双工之间进行选择切换成为了研究的热点方向。协作通信是一种将多个无线设备通过协作协议统一控制起来,取得比起独立工作更好性能的通信方式。多个彼此进行协作通信的中继被称为协作
随着信息技术的高速发展,无人智能系统和移动智能机器人已经逐步走入到了人类日常生活中,并在混合现实、应急救援和无人驾驶等任务中发挥着重要作用,其中的关键技术即时定位与地图构建(Simultaneous Localization And Mapping,SLAM)引起了研究者们的广泛关注。视觉SLAM系统以其成本低和容易部署的优势,用于服务人类日常生活的可能性更大,逐渐成为了SLAM系统中的一个研究热
近年来,随着海洋事业的发展,各国对于水声通信系统的研究越来越重视。水声前导信号的检测是水声通信中一个重要模块。前导信号的误检和漏检一方面会导致通信的失败,另一方面还会对水声通信设备的寿命造成影响。而水声信道作为目前最复杂的信道之一,其多径效应严重、多普勒效应明显、干扰种类繁多的特点导致水声前导信号的检测困难。本文从两个方面研究了前导信号的检测和识别问题,并对所提出的方法进行深入的理论性能分析,该理
伴随着移动互联网和人工智能的迅速发展,各类移动终端应用越来越大型化,对于计算资源的需求也越来越高。由于移动终端的设备和体积限制,其计算能力和能耗都无法完美地支撑应用在本地运行。传统的云计算范式在处理计算任务时,通常存在较高的传输时延,因此无法满足时延敏感型应用的时延需求。由此,研究者提出了移动边缘计算,其核心思想是将云计算的部分处理能力下沉至距离用户更近的网络边缘端,从而可以很好的解决以上问题。显
第五代移动通信技术由于其具有满足海量数据的传输的特性,成为了实现万物互联的关键技术之一。而信道编码技术作为其中对抗信道传输干扰的重要手段,编码的性能直接影响了通信领域中的信息传输速率。Polar码作为一种发展时间较短的码字,在第五代移动通信技术的标准制定中成为其增强移动宽带(Enhanced Mobile Broadband,e MBB)应用场景下的短码标准。通过研究发现,虽然Polar码在特定的
随着单无人机向多无人机协同技术的发展,多无人机应对不同需求实现编队控制的应用场景增多。相对单无人机,多无人机能够携带不同设备,完成单无人机无法完成的任务等优点,目前的多无人机编队控制仍有协同能力低,自主能力不足,无法应对突发情况,实时性低等问题,无法满足不同飞行任务对编队队形控制的要求,因而展开关于群体智能控制方向的多无人机编队控制研究迫在眉睫。为解决上述问题,将多无人机协同编队控制问题,分为编队
随着移动终端设备数量的增长和人工智能技术的发展,移动设备对运行实时应用(如人脸识别、AR/VR)的需求大幅增加。然而,资源有限的移动设备通常无法承载此种计算密集、时延敏感的应用,导致用户体验的下降。如果采用传统的云计算解决方案,也存在传输延迟过长、流量拥塞,大量数据处理成本和通信成本高的问题。在此背景下,移动边缘计算(Mobile Edge Computing,MEC)将计算基础设施从远程云数据中
无人机集群自组网相比于地面MANET网络,在三维空间中具有更大的灵活性,在军事和救灾场景下具有重要的应用意义,与此同时,由于无人机之间距离远,无人机集群网络更加稀疏,无人机飞行速度较大,通信链路容易中断失效,进行三维空间网络拓扑控制要考虑更多的因素,而现有的二维平面网络拓扑控制技术应用在无人机集群自组网具有很大的局限性,因此,研究基于三维空间的有效拓扑控制是有必要的。为了构建具有一定容错性和抗毁能