面向试卷的手写英文识别关键技术的研究与实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:a30355115
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的到来、计算机技术的不断发展以及人工智能的兴起,信息化、数字化、智能化成为了社会发展的趋势。目前,在考试领域,考生考卷大多以纸质或图像的形式进行存储,为了方便对这些考卷进行分析、保存,需要将这些纸质或者图片上的数据转录成文本数据,进而实现对考生试卷的信息化与智能化处理。面向试卷的手写英文识别就是对试卷信息化与智能化处理的一种关键技术,本文从试卷图像的单词分割、单词识别以及单词识别后处理三个方面入手,设计并实现了相关的技术,并成功应用于高考英文试卷的识别中。本文对面向试卷的手写英文识别相关技术的设计与实现内容如下:(1)单词分割,本文根据试卷图像背景区域远大于前景区域,且二者灰度分布差异较大的特点选择了全局的二值化处理方法;根据考生答卷相邻文本行之间空隙大但仍有部分交错特点,设计并实现了结合投影法和动态行分割法的文本行分割方法,然后使用了经均值滤波处理过的投影法进行了单词分割,取得了良好的效果;最后对分割的异常进行了分析,统计出了过拟合、欠拟合和书写错误三种分割异常情况,并提出了相应的解决方案。实践表明,本文设计的单词分割方法简单且高效。(2)英文单词识别,本文设计并实现了一种基于Seq2Seq的手写英文单词识别网络,首先使用本文设计的带有5个卷积层的卷积神经网络(Convolutional Neural Networks,CNN)提取单词图片的空间特征,再使用改进的多层双向的长短期记忆人工神经网络(Long Short-Term Memory,LSTM)作为编码器对空间特征进行编码,将特征编码输入带有注意力机制的LSTM解码器进行解码,并使用了集束搜索的方式扩大解码范围,进一步提高了识别准确率。最后在相关数据集上对英文单词识别模型进行了训练和测试。结果表明,本文设计的模型取得了令人满意的效果。(3)单词识别后处理,本文对单词识别的常见错误进行了统计与分析,设计并实现了基于贝叶斯理论的单词识别纠错方法,这种方法根据概率模型对识别结果进行了纠正。实践表明,本文设计的方法在一定程度上提高了英文单词识别的准确率。
其他文献
暴雨灾害是我国破坏性强的自然灾害之一,在发生的同时通常伴有泥石流、滑坡等一系列次生灾害。广西前汛期(4-6月)降水强度大,降水量多,兼受复杂的地理环境影响,具有局地性、突发性和历时短等特点,是华南区域频发暴雨降水的主要地区之一。基于广西1961-2017年共57a的前汛期暴雨强降水数据,文章综合运用EOF分析、小波分析、Mann-Kendall检验、滑动T检验等方法讨论地形因素对降水的影响,并着重
记笔记策略是学生在课堂上使用最普遍且最便利的一种学习策略。在课堂上使用记笔记策略能帮助学生集中注意力,促使学生对所学知识内容的选择甄别及理解,并促进学生思维的发展;而且,所记笔记也是课后用来复习功课、巩固新知的载体,是积累材料、丰富知识的来源。调查研究学生在课堂上记笔记策略的使用现状,从近处看有助于他们更高效的使用记笔记策略,帮助学习课堂知识;从长远看,有助于学生实现自主学习,达到学会学习,为今后
本研究观察莪术醇对单侧输尿管梗阻(UUO)大鼠肾组织肌醇依赖酶1(IRE1)通路调控机制的影响。通过单侧输尿管梗阻建立大鼠肾间质纤维化的动物模型。将所选大鼠随机分为莪术醇低
转录阻遏蛋白Rex在包括枯草芽孢杆菌(Bacillus subtilis)、金黄色葡萄球菌(Staphylococcus aureus)、肺炎链球菌(Streptococcus pneumoniae)、天蓝色链霉菌(Streptomyces coelicolor)等多种革兰氏阳性细菌内保守存在,通过感知细胞内NAD+/NADH比例反映氧化还原状态,维持细胞内氧化还原平衡。一定条件下,Rex蛋白特异
在未来网络技术背景下,以软件定义网络(Software Defined Network,SDN)为代表的新型网络技术打破传统网络平面整合结构,将控制与转发功能分离,其可编程控制与集中管理特点为网络规模的扩展提供了优秀的解决方案,目前已在数据中心网络、骨干网与广域网等场景得到了应用。但SDN网络在实际应用中仍面临一些安全性问题,当网络被攻击时,快速精准地检测入侵行为对保障网络安全运行具有重要意义。为
欧李(Cerasus humilis(Bge.)Sok.)为蔷薇科(Rosaceae)樱桃属(Ceraras)经济林木,是中国特有的多年生物种。欧李原产于偏远的北部山区,荒野和其他一些人口稀少的地区,对干旱,寒
近年来,深度学习的兴起使得人们日常生活中接触到许多与人工智能相关的技术和产品。国家对人民的安全问题也愈加重视,安防产业也因为深度学习、计算机视觉等领域的落地得到了长足的发展。行人重识别是安防产业、视频监控其中一个重要的研究方向,它在智慧城市领域有着举足轻重的作用。随着深度神经网络的快速发展和智能视频监控需求的不断增长,行人重识别成为工业界和学术界共同关注的课题,它的首要任务是从大量监控视频中准确识
病毒性传染病严重威胁着人类的健康,随着世界经济的快速发展和全球化步伐的加快,新发、突发病毒性传染病接踵而至并蔓延流行。由于新发病毒性传染病发现时间短,许多安全且有效的疫苗和药物仍处于研发阶段,小分子药物对治疗病毒性传染病存在巨大潜力,可利用天然或合成化合物筛选抗病毒活性物质,以期找到特异性高、毒性小的抗病毒药物,解决传染病病原体感染机制不明情况下药物研发的盲目性。本研究依托中检院拥有的中药化学提取
药品是人类生活中不可或缺的物品,对维护人们身体健康具有重要作用。近年来,我国医药费用过快增长问题日益突出,最明显的是药品价格上涨速度远远高于一般商品,药品价格问题成为广大社会媒体的焦点,更加受到人们的关注。虽然我国政府长期以来一直致力于对药品价格的管制,在一定时期内对药品价格的控制发挥了积极的作用,但随着医药市场环境的变化,并没有有效解决药品价格不合理的问题,反而造成政府对药品价格管制失灵。目前,
广告市场有很多独到的创意和广告媒体,为商品和服务的推广开辟了新的机会。如今,广告市场更需要新的解决方案和与目标受众互动的有效方式。广告适应我们的生活方式和环境,有时会以意想不到的方式围绕着我们。环境媒体是广告界最热门和热门讨论的话题之一。非传统的接近向消费者传递广告信息一直非常有吸引力。现在有许多方式来放置户外广告,但其有效性首先取决于创造力。本文重点介绍环境广告方法的重要性和作用。环境媒体的“特