基于深度神经网络的中文文字识别模型设计与实现

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:wubo02402
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文文字识别指将图片中的汉字信息识别出来。文字识别通过提取图片文字信息特征来预测图片中文字的真实序列,是计算机视觉领域研究热点之一,具有广泛的应用场景。本文基于深度学习方法,研究文字识别深度模型算法。目前经典的卷积循环神经网络(Convolutional Recurrent Neural Network,CRNN)模型在文字识别领域准确率达到很高,但受文字尺寸不同、图像分辨率低,易混淆形近字等因素影响,准确率仍有待提升。本文结合Inception网络结构和注意力机制思想,对CRNN模型进行了改进设计,本文的主要研究工作如下:(1)设计基于Inception网络文字识别算法。研究分析Inception网络原理、结构和性能,设计实验与常见的几种深度网络CNN、VGG和Resnet进行对比,证明了Inception网络结构的有效性。本文设计的基于Inception网络文字识别模型,特征提取层加入Inception网络模块,Inception网络模块多滤波器支路能够学习不同尺度局部区域特征,针对网络同层的特征使用多核卷积,增强了特征提取的能力。经过实验对比分析,在ICDAR17数据集、ICDAR19数据集和自建数据集上,新文字识别模型比基准模型文本行准确率平均提高5.97%。(2)设计基于注意力机制的文字识别算法。针对CRNN模型中BLSTM循环层的性能问题,设计一种注意力机制和LSTM组合结构代替基准模型中双层BLSTM网络结构,增强了循环层辅助推断识别能力。注意力机制计算不同特征贡献度生成权重概率分布,循环单元根据权重值对网络序列进行融合重组,输出的预测序列更接近真实标签。经过实验对比分析,在ICDAR17数据集、ICDAR19数据集和自建数据集上,新文字识别模型相对基准模型在文本行准确率、最大公共子串准确率和编辑距离准确率三种评价标准下平均提高5.11%、6.76%和10.09%。(3)搭建小型文字区域检测与识别系统。本文采用EAST文字区域检测模型和本文设计的新文字识别模型,结合图像预处理、数据采集相关技术,搭建了文字区域检测和识别的系统。
其他文献
本文研究一个对称有角二维区域1/4圆盘上不可压Euler方程的弱解的涡量“梯度”的增长.方法是通过明确写出区域上格林函数以及速度场的Biot-Savart公式,从而对某一弱解估计角
铁电随机存储器(FRAM)是利用铁电材料的剩余极化双稳态特点实现存储,具有读写速度快、低功耗、抗辐射性能好等特点,在汽车电子、航空航天等对安全性、可靠性要求特别高的领域有着非常重要的应用潜力。PZT铁电薄膜具有较大的剩余极化,良好的电滞回线矩形度,低极化反转电压以及快的反转速度等特点,在FRAM中有着不可替代的地位。然而,其抗疲劳性能差是阻碍其应用的一个瓶颈。当PZT与电极材料Pt集成时,随着极化
本课题在项目组前期工作的基础之上,应用STM32F407IGT6与EP4CE10F17C8N作为核心控制器,对FPGA中各个功能模块电路、时序和指令系统进行了优化设计。本文主要研究采用ARM和FPG
《尤利西斯》是爱尔兰著名作家詹姆斯·乔伊斯创作的一部杰出的现代意识流小说,被誉为二十世纪英语文学最伟大的作品,《尤利西斯》极具实验性和创造力,被许多读者奉为“天书
随着我国计算机技术的不断进步,我国的测量行业正在向全自动化方向发展。传统的手工测量过于缓慢,并且测量误差大,已经不利于推动社会的发展。利用计算机视觉技术对信息进行
化石燃料过度燃烧造成的污染及能源短缺问题已逐渐严重,人类急需寻找到一种绿色可再生的能源来取代不可再生的化石能源。氢能,被视为解决当前能源危机、全球变暖问题的重要可
自旋和电荷是电子所具有的两个内禀的属性。信息的处理和传输主要应用了电子的电荷属性,而自旋属性则被用作信息的储存,常常由磁性材料来完成。如果一种材料能够兼具电子的电荷属性和自旋属性,无疑将会促进自旋电子学器件的快速发展。稀磁半导体同时具有铁磁性和半导体的性质,吸引了研究者们的广泛关注。与此同时,随着电子器件的进一步小型化,将二维材料与自旋电子学相结合,已经成为新的发展趋势。利用不同二维金属、半导体和
普通摩擦减震装置构造简单,耗能效果好,是目前工程结构中常用的耗能减震装置之一。但是,作为一种被动减震装置,该装置不具有自适应能力,不能根据结构减震需求主动改变其摩擦
外界环境温度影响下,黄土地区,表层土体呈现冬季冻结,春季融化,甚至出现夜冻昼融现象。然而反复冻融作用下,黄土工程性质发生劣化,不利于黄土地区工程建设及维护,如冬末春初
灰土桩是一种广泛用于处理地下水位以上湿陷性黄土地基经济、有效的方法,但是对于陕西渭北、甘肃、宁夏等地大厚度及干旱地区湿陷性黄土地基处理时,存在桩间土无法挤密这种现