特征提取技术在脱机手写体汉字识别领域的应用研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:luoqiaoshui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
脱机手写体汉字识别是一种实现中文信息的自动化录入技术,它的研究不仅具有很高的理论价值,更有着广泛的实用价值。由于汉字类别多、字形变化不规则、相似字多和字体结构复杂等特点,使得脱机手写体汉字识别成为了模式识别领域中极具挑战性的课题之一,甚至可以代表模式识别技术的最高水平。  目前,脱机手写体汉字识别系统主要由输入图像、预处理、提取特征、弱分类、强分类和后处理等几个环节组成。本文以特征提取环节为核心对脱机手写体识别进行了深入研究,研究的主要内容如下:  1.输入图像和预处理。本文通过扫描仪输入图像,然后对输入的图像进行二值化、去噪、平滑化、汉字图像的行列切分、归一化等处理。其中汉字图像的行列切分是在二值化后的图像上找出切分点对原始图像的灰度图进行的切分,因此切分后的单字图像需要再次进行二值化、平滑去噪、归一化等操作,目的是为了更好地提高汉字图像的二值化效果。  2.汉字的细化和重构。通过汉字的细化可以减少汉字的一些冗余的信息,而通过汉字的重构可以使汉字更加规范化。本文的重构方法是一种根据细化后汉字的各个笔划走势进行重构的方法,正是由于这种根据笔划走势的特性,使得其能够比较准确地确定每一笔划属性。  3.特征提取和选择。通过详细介绍现有的几种统计特征、结构特征以及两者相融合的特征,本文提出了一种新的基于笔划方向分解的双弹性网格模糊特征提取方法,此方法不仅考虑到汉字的笔划结构和汉字整体相关性,而且通过利用对角弹性网格技术弥补了纵横网格技术对汉字图像撇和捺笔划模糊特征提取的不足之处。此外,基于主成分分析的特征选择也是本文一个研究的重点。  4.最后本文针对不同的特征提取方法对强分类和弱分类结果的影响进行实验分析,力求找出能够区分不同汉字的特征提取方法。实验表明,通过对提取得到的一次粗外围特征进行加工处理,能够更有效地将全包围汉字从杂合体字中分离出来。此外,本文提出的双弹性网格模糊特征在强分类中表现良好。
其他文献
随着飞机速度、机动性能的提高,飞机座舱仪表系统也变得越来越复杂。飞行员在飞行过程中需要在众多仪表中判读数据,并作出战术动作,飞行操作负荷大,不利于提高飞行员的态势感
当今导航精度成为国家提升军事力量的一个重要指标,由早期的对单个导航算法的改进,到现在组合导航的研究,世界各国对此都投入了相当大的精力。根据现有研究可知从单个的导航
学位
近年来,随着航空航天技术的发展,大角度机动飞行开始在飞行器的使用中出现,这种飞行方式要求飞行器的姿态角能在整个空间内发生变化,因此实现大角度机动飞行姿态运动仿真具有极为
近年来,我国煤矿开采的深度逐渐增加,并且已经成为一种发展趋势。对深部开采条件下压力分布规律的研究也将成为煤矿安全生产的前提条件。根据钱鸣高院士的“砌体梁”和宋振骐
与机器人有关的研究具有很深的历史背景,对人类的生活有着重要的影响。机器人在工业、家庭服务、医疗上有众多的应用。从1985年以来,机器人在神经外科、骨科手术和其他各种医学
本研究的目的是设计一种用于天线电子扫描雷达系统(AZ-EL)俯仰角和方位角的控制器,这两个角度是控制雷达跟踪目标时的主要特征。然而,由于整个系统遭受诸如高速运动的风之类的干
开关磁阻电机(SRM)具有结构简单、坚固、成本低、工作可靠、控制灵活、运行效率高等诸多优点。因为其具有很好的节能效果,所以它在电动车、纺织工业、焦炭工业、家电行业、油
等离子体加工技术以其优越的性能,广泛应用于能源、材料、物质、环境等诸多专业领域。而目前这些领域中采用的等离子体加工电源已经不能满足其发展的需求,数字化、智能化的等离
大脑由上亿个神经元耦合关联构成一个复杂系统,以完成各种生理和心理活动。伴随神经影像学的蓬勃发展,科学家得以对大脑不断进行更加深入的探索。功能磁共振成像(fMRI)由于其