论文部分内容阅读
汉字图像识别是计算机视觉与模式识别技术的重要应用领域。近年来,围绕汉字图像识别的研究已取得很多重要进展。但如何提取与类别密切相关的汉字图像特征,获得尽可能高的互信息熵仍是汉字识别的重点和难点,因此特征的准确提取与识别是汉字识别研究首先关注的问题。 论文涉及以下几个方面工作: 1、汉字识别特征的提取。研究了如何从汉字图像中提取横、竖、撇、捺等笔划特征信息,提出了汉字笔划的两种提取方法:1)提出了一种基于数学形态学的图像汉字笔划细化和提取方法。根据汉字的结构特点,研究制定了一组新的图像汉字笔划细化的结构元素序列,不仅有效地抑制样本汉字细化后笔划的扭曲和歪斜,而且保持了原样本图像汉字的连通性和拓扑性的骨架。在此细化的结果基础上,定义了一种基于边缘检测的新的汉字笔划提取算法。2)提出了基于Gabor滤波器的笔划提取算法。针对Gabor滤波器在纹理图像的识别方面能起到仿人视觉识别的特性,利用Gabor滤波器在时域中的方向性,分别在0、45、90、135度方向进行滤波得到四幅灰度子图像,再对四幅灰度子图像采用自适应算法和最优阈值算法进行二值化。两种方法均能提取出横、竖、撇、捺四个方向笔划的形状、形态、形式等结构和统计信息,效果良好。 2、汉字特征模型的建立和汉字图像的编码。在基于汉字特征的可识别性和可提取性基础之上,提出了选用笔划作为基元,采用先结构特征后统计特征的识别方法,运用模糊数学定义了汉字图形的笔划形态、形式、位置、长度等特征信息,并以此为基础构建一套新的汉字图形的特征模型和编码方法。 3、汉字图像的识别算法。围绕该汉字结构模型和编码方法,采用冒泡算法对提取出的待识别的汉字特征进行隶属度排序,建立了一套有效的识别算法。最后,给出了一种基于汉字图形轮廓特征的误差估计方法,并利用误差估计初步建立了一套带有反馈的汉字识别系统。