基于卷积神经网络的孤立手写体汉字识别研究

被引量 : 0次 | 上传用户:gz200009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写体汉字识别在中文自动化处理和智能输入等方面有着广泛的应用前景,但由于手写体汉字具有类别多、结构复杂、相似字多、字形的多样化等特点,使得手写体汉字识别成为相关研究领域中的一个难点与热点。本文主要以离线和在线的孤立手写体汉字样本为研究对象,在对前人的工作进行了认真的学习和总结基础上,做了大量的实验研究,采用深度学习技术进行手写体汉字识别,并得出了一些有用的结论。论文的主要研究内容如下:首先,本文采用卷积神经网络对孤立手写体汉字进行识别,通过一系列对比实验,分析了卷积神经网络在汉字识别任务中的性能,验证了其在手写汉字识别领域的可行性。实验表明,得益于卷积网络强大的特征表达能力,我们能够用非常复杂的深度网络结构对手写体汉字进行建模,同时,其“端到端”的特性也简化了汉字识别的流程。其次,本文对传统的手写体汉字预处理和特征提取方法做了深入的研究,通过人工进行特征提取(方向梯度特征,方向线素特征等),然后再利用卷积网络进行特征学习,获得了比直接使用汉字样本更好的识别率,验证了传统的特征提取方法与卷积神经网络相结合能产生更好的识别效果。再次,针对汉字类别过多所导致的网络参数不易收敛、训练速度慢等问题,本文采用了基于迁移学习的监督式预训练方案。通过预先对小字符集(例如,手写数字库MNIST)进行网络训练,以获取一个比较好的初始化参数,并在此基础上进行大字符集的手写汉字网络训练。实验证明,该种方法能够使卷积网络的参数迅速收敛,同时保证识别率不出现大的浮动。最后,本文在中科院自动化研究所发布的手写汉字数据库CASIA-HWDB和CASIA-OLHWDB上进行了手写体汉字识别实验。实验表明,相比其他方法,利用卷积神经网络对孤立汉字进行识别使单字准确率有了明显的提高。
其他文献
农业基础设施建设为农业的稳定发展提供物质基础,使农业经济长期受益,从而为经济发展注入新的活力。我国农村基础设施投资和经济增长存在长期稳定的关系,但是两者仅存在单向
简约实用语文备课,为课堂教学顺利展开创造良好条件。教师潜心研读教材、深入学生群体了解学情、对教法学法展开优化整合,都可以极大提升课堂教学品质,有效彰显语文教学价值。理
本文以希区柯克的经典影片之一《后窗》作为文本,根据弗洛伊德的结构论中对人的本我、自我、超我的区分理论来进行分析,讨论《后窗》是怎样在故事情节、人物特征、观众自我等
铝合金由于密度低、导热性良好在航空航天领域得到了广泛的应用。然而由于铝合金较低的强度和硬度,使得铝合金的应用受到了限制。通过激光熔覆Al-Ti粉末,形成的Al-Ti系金属间
作为一种新型的工具材料,Ti(C,N)基金属陶瓷具有许多优良的性能,因而得到了广泛的应用,特别是近年来发展迅速。本文用传统的粉末冶金方法制备了不同ZrC含量的Ti(C,N)基金属陶瓷试
多点成形(Multi-point Forming,简称MPF)机是一种先进的板材柔性成形设备。多点成形压力机机架采用四柱式液压机结构,作为设备的基础支撑部件,机架的强度、刚度及稳定性至关
本论文选择MgNi、Mg2Ni、Mg45Ni50Ti5、Mg45Ni50Al5、Mg55Ni35Si10和Mg65Cu25Gd10这六种质轻价廉或具有较大玻璃形成能力的合金体系作为研究对象,从原料单质粉末开始,采用高
目的:分析用浆乳方联合中医外治法治疗浆细胞性乳腺炎的临床疗效。方法:将2015年1月至2018年3月在江苏省响水县人民医院接受治疗的56例浆细胞性乳腺炎患者分为观察组和对照组
谷歌(Google)对昔日通讯终端巨头摩托罗拉(Motorola)移动业务的收购,被认为是近10年来发生在无线设备行业最大的并购案,也被认为给全球IT业投来一枚重磅炸弹,除了天价交易额
农业是中国重要的基础性产业之一,随着信息与网络的时代的到来,受到了强烈的冲击。信息成了继材料、能源技术之后的第三大社会发展资源。信息通过互联网络达到了信息资源共享