脱机手写体汉字识别的特征提取研究与实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户:eu2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉字识别是用计算机自动辨识印刷在纸上或人写在纸上的汉字,学科上属于模式识别和人工智能的范畴。汉字识别涉及到模式识别、图像处理、人工智能、形式语言与自动机、模糊数学、组合数学、信息论、中文信息处理等学科,也涉及到语言文字学、心理学、仿生学等,是一门综合性技术。汉字识别是一种难度非常大的模式识别。这是因为:从客观上讲,汉字是一种特殊的模式集合,其模式种类很多,结构非常复杂,有的模式又十分相似,加上印刷质量与干扰的影响,以及人们在书写时的随意性使字形不够规范等原因,都使得汉字字符的识别十分困难。首先,预处理在手写体汉字识别中占有重要地位。本文讨论了手写体汉字的预处理方法,实现了传统的二值化、平滑算法,实现了一种基于图像有效区域的密度均衡原则的非线性规范化方法,它较之其他几种方法更能有效地减小同类字符之间的差异,更有效地提高了手写体汉字的识别率。在特征提取方面,本文提出一种模糊子笔画抽取方法,解决了因无限制手写体笔画随意性而使得抽取的子笔画不稳定的问题。计算字符边缘点“横”、“竖”、“撇”、“捺”的模糊子笔画属性特征,并将其与模糊网格相结合,生成模糊子笔画统计特征。此外,在特征提取方面,还提出了一种基于子块及其相关模糊特征的提取方法。这种方法既考虑了汉字笔画的分布特点,又很好地考虑了汉字拓扑结构上的相关性,是对人认知汉字机理的一种模仿,这对识别书写风格差异大、随意性强、结构变形大的手写体汉字,是一种很好的方法。最后,本文介绍了一个机器阅卷系统。包括其应用环境、主要功能、使用的主要技术。论文作者主要负责答案填涂区域的处理,并用本文提出的方法对姓名进行了识别实验。
其他文献
本文提出了一种融合显著性的动态场景背景提取算法,并把该算法运用到复杂场景下的进行运动目标检测与跟踪。当前国内外科研人员和学者已经提出了许多运动目标检测算法,其中帧差
随着CNGI(中国下一代互联网示范工程)核心网的开通以及各地驻地网建设的不断深入,IPv6大规模商用指日可待。目前,依托CNGI网,对IPv6技术进行研究探索,完成各种网络业务互通的
随着计算成本的下降以及微处理器体积的缩小,科学家想象中的“智能尘埃”逐渐成为现实。未来由微型传感器组成的大规模、高动态、高移动型传感器网络,在国防军事、环境监测、
近十年来互联网得到了高速发展,无论在世界范围内还是在我国范围内,网络已经成了我们生活中不可或缺的一部分。现在,网络已不再是简单的信息获取和传递的单纯媒介,它已经成为我们
测量Internet拓扑结构对于了解Internet的结构、仿真模拟Internet环境和分析Internet拓扑的演化规律等方面都具有重要意义,现实的需要推动了Internet拓扑测量研究领域的形成
数字图像处理是信息技术的一个重要领域,该技术的进步也是日新月异。然而,受多方面因素的影响,人们在使用各种方法对图像进行处理的过程中,常常会受到随机噪声的干扰。噪声的存
随着P2P网络技术的发展和进步,P2P网络上可以利用的资源和服务也越来越庞大。因此,如何在大量的资源和服务中查找到自己想要的资源和服务,成了P2P网络研究领域的一个难点问题
移动Ad Hoc网络是由一组带有无线收发装置的移动结点组成的一个多跳的,无中心、临时性的自治系统,它独立于固定的基础设施并采用分布式运行方式。网络中的每个终端作为结点可
随着互联网普及率的不断提高,网站上出现入侵攻击的现象愈发常见。与此同时,随着网站安全防范技术的增强,网站入侵攻击的手段方法也愈发多变、隐蔽、难以发觉。在中国绝大多数的
试验是新产品研制和技术改型中极为重要的验证和鉴定环节。通过试验获取的试验数据是宝贵的企业产品与决策信息。目前,在绝大多数企业中试验数据都处于传统的管理方式下,随着试