论文部分内容阅读
脱机手写体汉字识别作为超多维模式空间的分类问题是模式识别领域的一个研究热点。粗糙集理论是一种处理不精确、不确定与不完全数据的软计算方法。它建立在分类机制的基础上的,将分类理解为在特定空间上的等价关系,并将知识理解为对数据的划分,能够比较客观地处理不确定性问题。因此将粗糙集理论运用在手写体汉字图像识别是具有理论研究意义和实际应用价值的。本文主要完成了以下几个方面的工作:1、手写体汉字决策信息系统构建。根据粗糙集理论中广义论域信息系统的概念,定义了手写体汉字信息系统。仿人在识字过程中采用有导师学习方式,通过在手写体汉字信息系统中加入样本汉字的真实属性作为先验信息,建立了一种手写体汉字决策信息系统2、特征量约简。采用“熵”值表征决策信息系统中手写体汉字特征重要性,设计了一种具有先验知识指导的手写体汉字特征量约简算法,减小识别过程的特征冗余度。3、汉字多样本的冗余度约简。基于粗糙集理论的规则冲突判断,给出一种启发式冗余样本约简方法,约简多样本汉字集中的冗余度。4、多字体汉字识别。建立了手写体汉字决策信息系统的多模板多特征样本汉字集,提出一种基于规则置信度的汉字规则融合识别方法,并设计了一种基于粗糙集的手写体汉字识别系统。5、选取SCUT-IRAC手写体汉字样本库作为实验样本,对本文研究的基于粗糙集的特征约简和样本约简方法,以及规则融合识别方法进行了实验验证。选取了SCUT-IRAC手写体汉字样本库作为实验样本,在MATLAB 6.5环境下,进行了仿真实验验证。实验结果表明,本文研究的特征约简方法对手写体汉字多维统计特征具有较好的约简结果;启发式冗余样本约简方法能对汉字多样本的冗余度进行有效的约简;规则置信度融合识别方法能提高手写体汉字识别正确率。