论文部分内容阅读
脱机手写体汉字识别是模式识别领域中的热门课题,具有重要的理论意义和实用价值。由于汉字的种类多、结构复杂、相似字多,且脱机手写体汉字存在形变及不能反映手写过程信息等因素,使得脱机手写体汉字识别成为了汉字识别领域中的难题之一。本文运用过程神经网络的理论方法,模拟人类认知汉字的思维过程,研究了基于过程神经网络的脱机手写体汉字特征提取与识别方法,对机器“认知”脱机手写体汉字进行了探索。论文的主要研究工作如下:1、构建脱机手写体汉字的多特征数据表。模拟手写体汉字的书写习惯和汉字形码输入法,把脱机手写体汉字的特征表征为笔划类型数量、笔划类型位置、拓扑结构类型数量和笔划书写顺序特征,在研究脱机手写体汉字特征容错性表征的基础上,构建了待识别脱机手写体汉字的多特征数据表。2、分析并建立用于提取脱机手写体汉字特征的过程神经网络模型。利用过程神经网络能够处理时空二维信息的特点,构建用于提取脱机手写体汉字特征的过程神经网络模型,选用脱机手写体汉字样本及改进的BP算法对网络进行训练;用训练好的过程神经网络提取脱机手写体汉字的多重特征,完成脱机手写体汉字的多特征数据表。3、制定具有容错性的脱机手写体汉字识别匹配规则。模仿人类对比判断能力,制定具有容错性的脱机手写体汉字识别匹配规则,把待识别脱机手写体汉字的多特征数据表与标准仿宋印刷体汉字的多特征数据表进行容错匹配识别。在MATLAB R2009b的仿真软件平台上,选取SCUT-IRAC HCCLIB字库中包含各类结构的脱机手写体汉字,对本文研究的基于过程神经网络的脱机手写体汉字特征提取与识别方法进行了验证实验,实验结果表明该方法能较好地提取脱机手写体汉字特征,识别率较高。