基于深度学习的汉字识别方法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:lvsby2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字存在于人类生活过的各种不同的形式当中,文字对于整个社会的经济和科技的交流及其发展都有着非常重要的作用,同时文字也是目前人类生活当中无可替代的一个重要部分。面对这些比较复杂而且基数比较庞大的数据,如何通过构建不同的模型或者不同的算法从中提取所需要的有价值的信息,去除其中的大量垃圾信息,一直以来都是文字研究的一个重要难点问题。传统的汉字识别主要受限于特征提取,而深度学习中的卷积神经网络模型具有能够自动地从大量样本中提取特征的优势,因此本课题通过结合卷积神经网络模型及传统的模式识别的汉字识别应用进行了一定的研究,本论文的主要研究工作可以概括为以下几个方面:(1)对传统的汉字图像识别的方法进行了研究。采用支持向量机与决策树集合作为分类器,分别采用方形特征、基于Gabor的特征及弹性网格特征三种不同预处理下进行了对比实验。实验结果显示,形态学转换的数据集预处理的方法结合弹性网格特征,准确率较传统方法能够获取更好的识别效果。(2)研究了基于注意力机制的卷积神经网络模型。为了能够有效地解决形相似的汉字微小差异导致在训练过程中存在的丢失问题,将注意力层次与AlexNet的卷积层次进行有效结合,进一步地提高汉字图像中微小差异的权重,同时也进一步地减少了卷积层次对于丢失信息的影响。(3)在对汉字识别进行实验的过程中,进行了数据增强方面的研究,研究的结果展示通过合理地对数据进行增强扩展之后,能够有效地避免深度卷积神经网络过度拟合的问题。
其他文献
以新建宝鸡到兰州的铁路工程为例,对高压富水隧道注浆堵水施工技术进行研究。主要对小型注浆设备的研制和运用以及具体施工方案的选取做出深入研究。主要包括注浆工艺和材料;
近年来吉尔吉斯斯坦旅游产业发展成就显著.吉尔吉斯斯坦旅游资源丰富,有著名的伊塞克湖和高山等自然旅游资源;吉尔吉斯斯坦旅游特点显著,但由于旅游产业发展客观规律和吉尔吉
<正>本文通过某猪场蓝耳病、猪伪狂犬混合感染引起母猪流产案例的分析,提供相关防治经验,供同行参考。某猪场存栏母猪60头,2017年6月份免疫猪瘟疫苗前有3头母猪流产,其中1头
神农是传说中的人物,尝百草却是实实在在发生过的事情。某位先民,在田野中被某株野葱或香椿树散发的异香吸引,在小心翼翼地尝食后,他迷上了这不同寻常的风味。经过千百年的精
微信是互联网时代营销的新载体,越来越多企业试水微信营销。本文从消费者行为的角度,根据AISAS模型构建了旅游公司微信营销效果评价的指标体系,然后利用德尔菲法征求了专家对
“习明纳”是一种讨论学习的教学模式 ,它有利于促进学生的自主学习 ,是施行研究性学习的有效途径。笔者概要介绍了“习明纳”模式在促进学生能力发展方面的独特作用 ,以及在
目前,在大众创业、万众创新的号召下,通过优化服务方式促进地方科技创新创业成为了地方政府的重要任务之一。天津市南开区一直以来不断加强科技创新创业服务能力,积极促进区
<正>在今日日本,有越来越多年轻女性深入远离尘世的山间林中寺庙,在清静犹如月球上的"寺庙旅馆"内借住上一段时间,希望通过别样的旅途和别样的住宿重新审视自己的人生,并从中
不断剧增的生活垃圾是人类面临的一个亟待解决的问题,关系着人口、资源、环境是否能协调发展。我国垃圾的主要特点是成分复杂、含水率高,其中厨余垃圾和可燃垃圾比例较高。如
侥幸心理是目前研究较少的一种心理。西方文化中的侥幸心理与中国文化中的侥幸心理相差甚远,不能沿用西方的研究方法。本研究在实验一使用自创的“概率事件一主观概率估计”