深度学习在手写汉字识别中的应用研究

来源 :天津科技大学 | 被引量 : 0次 | 上传用户:qianjiuzhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉字识别在我们的生活和工作中被广泛应用,目前手写汉字的识别技术已经很成熟了,但是对于一些特定场合的应用,比如在文字方向、字体和背景都多样化的书法识别中,仍然存在识别率大打折扣的现象。经过研究发现,识别率降低的原因可能是汉字区域和朝向的检测存在一定的问题,本文针对复杂书法字画的应用场合,设计了一个手写汉字识别系统。经过验证,本系统提高了在复杂书法字画中的汉字识别率,而且该系统还可以应用于类似的复杂背景场合以及多文字的汉字识别中。汉字检测作为汉字识别的第一步,首先,本文提出对汉字区域进行检测的模型是Advanced EAST网络模型,实验中对主要的神经网络VGG16进行了设计,用Ro I层代替其最大的池化层,能够利用Ro I层对图像进行多尺度变换,最后对图像统一到相同大小的尺寸,并且在实验中改进了损失函数,使用Dice损失和DIoU损失函数,与之前的网络模型相比,改进后的网络模型可以达到对文本框更好的标定,对汉字区域进行更准确地预测。其次,在实现对汉字区域准确预测的基础上,实验选取经典卷积神经网络LeNet-5对汉字进行识别,在网络模型中加入区域加权系数,实现对特征图的不同区域给予不同的关注度,能够让汉字的轮廓变得更加明显,使得对汉字的识别取得了不错的效果,并且对比了文本框标定前后的实验结果,最后,证实了汉字区域的有效检测可以提升网络模型识别汉字的准确率。本课题将深度学习应用于不同背景情况下手写汉字的检测和识别中,提高了该场合下手写汉字识别的准确率。该系统可以对多种背景情况下的汉字进行识别,例如拍照、截图、复杂场景、书法体、不同人写的相同汉字等,能够给出汉字的内容、定位位置、识别结果的数目、文本框四个顶点的坐标、汉字所在行的置信度以及输入图片的朝向,对比改进前后的实验数据,识别效果得到明显地改善。但是系统仍然存在许多需要改进的地方,本文针对不足之处提出了相应的解决方案,并对未来的研究进行了展望。
其他文献
随着近几十年来电力电子技术的发展,多相电力变换器在交流变频调速系统中的应用优势逐渐展现出来。三相-五相双级矩阵变换器是一种性能优良的新型电力变换装置,在多相电力变换器的发展中具有很大潜力。本课题以三相-五相双级矩阵变换器为研究对象,对其拓扑结构、控制策略、共模电压降低及五相电机调速系统应用进行了详细的研究。在拓扑结构上,从矩阵变换器的基本结构和调制原理开始研究,分析了不同约束条件下三相-五相双级矩
学位
随着制造业强国战略的第一个十年行动计划被实施,中国政府提出了《中国制造2025》。《中国制造2025》指出要加快机械、电子、航空、船舶、汽车、轻纺等行业生产的智能化转型,提高精确制造,敏捷制造能力;统筹布局,推动智能交通、智能家电、服务机器人等产品研发和产业化,提出关键工序智能化、关键部位机器人替代,生产过程智能化控制。智能自动化生产线是智能制造的基础之一,而机器人是自动化生产线所必备的设备。本文
学位
生物气溶胶的存在时刻影响着人类的生存环境、生产活动甚至生命质量。迅速而准确地对生物气溶胶分布进行测量可以有效获知病源微生物特性,为制定微生物传染源消杀措施提供理论依据。传统的生物气溶胶测量方法多为定点测量,在对高危险区和复杂环境进行生物气溶胶测量时,定点测量方法很难快速和准确地反馈生物气溶胶的实际存在情况。为满足室外立体空间高效生物气溶胶实际测量要求,本论文结合当下发展迅速、应用前景广泛的旋翼无人
学位
随着新一代信息技术的发展,我国的草原畜牧业结构开始从传统方式向着现代化、集约化、规模化的方式转变。在采用现代方式规模化养殖时,牲畜密度相对较大,这就对草场环境质量和草场资源的利用提出了更高的要求。草场环境监测作为草原畜牧业中非常重要的一部分,它既是影响畜牧工作的重要依据,又是保护草原环境的重要一环。若环境恶化会导致牲畜生病死亡,不仅造成巨大经济损失,还会引起多种传染病,间接危害人类的健康。因此,开
学位
随着社会经济的快速增长,城市建筑越来越密集,结构越来越复杂,导致火灾隐患越来越多,火灾的数量逐年上升。火灾事故不仅造成巨大的经济损失、威胁人民生命健康,还影响社会的稳定和发展,因此火灾报警在消防系统中至关重要。针对火灾环境消防参数的采集、传输、存储及远程平台监管的问题,本文结合物联网技术、传感器技术、无线传输技术等,提出一种基于物联网的消防监测系统。本文以室内火灾相关参数为监测对象,采集室内的烟雾
学位
地震检波器是石油资源勘探工作中接收地震波的传感器,其性能优劣直接决定了勘探工作的质量。地震检波器的自然频率、阻尼、灵敏度、直流电阻等直流参数的测试技术已较为成熟,而交流参数失真度的测试易受噪声干扰,导致精度较低。本文针对检波器失真度参数展开研究,设计了基于STM32和μC/OS-Ⅲ的高精度、多频率检波器失真度测试仪。检波器失真度测试仪系统由下位机软、硬件设计部分和上位机软件设计部分组成。下位机硬件
学位
铌酸锂晶体具有优良的声光、压电以及非线性光学特性,其中Y切铌酸锂具有较高的机电耦合系数,可以有效地激发声表面波,因此是制作声光制器的首选切向之一。另一方面,利用薄膜结构可以更好地限制声表面波的传输。因此,在铌酸锂薄膜材料上制作波导声光调制器,不仅可以充分利用材料的性能,还能利用结构的优势进一步提高器件的调制效率,降低插入损耗。本课题针铌酸锂薄膜光波导声光调制器进行了一系列理论和实验研究,所获成果具
学位
土工合成材料是土木工程应用的合成材料的总称,被广泛应用于公路、水利、环保等多个领域,在各领域的工程中发挥着日益重要的作用。为了保证工程的质量与安全,土工合成材料产品的性能检测尤为重要。课题对土工合成材料直剪拉拔试验机进行研究,以伺服驱动系统替代传统试验机中的液压或砝码装置作为加荷装置,在此基础上设计一种便捷的、高精度的、自动化程度高的直剪拉拔试验机检测与控制系统,实现对土工合成材料的直剪摩擦特性和
学位
随着我国经济增量与科学技术的飞速发展,工业现场自动化、智能化程度越来越高,对于工业生产效率的要求也日趋增长,由自动控制来代替人工人力是我国工业发展的必然趋势。在我国每年工业生产线都要运输上百亿吨箱体货物,而如此大体量的市场,很多工业环境仍然以人工集中搬运为主。为了提高生产效率,很多企业引入了KUKA(库卡)、FANUC(发那科)、ABB等拆垛机器人,但是由于其大多为固定线路固定抓取点的拆垛机器人,
学位
针对老旧生产车间向信息化的提升,本文对离散型生产的管控系统进行研究,采用数字孪生技术对系统进行改进。构建了基于数字孪生生产管控系统物理层、信息层与系统层的架构,实现对车间内设备运行状态的即时监测和过程统计。车间孪生系统的物理层,以E18-D80NK漫反射式光电开关、直流继电器、欧姆龙中间继电器等作为信号采集模块,克服了生产现场设备老旧、种类多、数据信号形式繁杂的困难,提高了设备信息采集覆盖面;采用
学位