论文部分内容阅读
笔迹鉴别是通过分析手写笔迹的书写风格来判断书写人身份的一门技术。随着应用领域的不断扩展,笔迹鉴别技术已经成为计算机视觉和模式识别领域一个十分活跃的研究方向。本文基于多特征数据融合与支持向量机技术,研究了行之有效的离线中文笔迹鉴别方法,为计算机笔迹鉴别系统的实现提供技术支持,并进一步拓展笔迹鉴别的应用范围和领域。本文主要研究内容如下:研究了笔迹图像预处理方法,主要包括对鉴别图像进行灰度化、二值化、归一化等。给出了一整套笔迹预处理算法,理论分析和实验验证了算法的有效性。通过对归一化和拼接处理后的笔迹图像特征向量的构建,进而提出了形状特征法。形状特征法主要是对笔迹图像的八连通区域的重心特征、偏心率、区域内凸壳中的像素比率、区域内围框中的像素比率的提取。其中重心特征反映的是书写者笔迹相对于水平方向上的偏移,偏心率、区域内凸壳中的像素比率、区域内围框中的像素比率主要反映的是笔迹中笔划交叉重叠的部分。纹理特征的提取是目前笔迹鉴别研究热点,本文讨论了纹理分析的基本知识和常用方法,将笔迹视为纹理图像,从纹理分析的基本方法入手,同时结合灰度共生矩阵和Gabor滤波器,分别提出了基于灰度共生矩阵提取笔迹特征的算法和基于Gabor滤波器提取笔迹特征的算法。灰度共生矩阵法主要是以灰度级的共生矩阵为基础的特征提取方法,提取能量、熵、相关度、对比度作为笔迹鉴别的特征。基于Gabor滤波器提取笔迹特征的方法是用一组预定且不变的频率组进行Gabor滤波,得到对应的能量组,从而把得到的均值和方差作为纹理特征。以上提取特征算法体现文本内容无关的优点,从而避免了对笔迹文字进行分割的操作,符合笔迹鉴别的习惯。本文在提取形状特征和纹理特征的基础上,采用多特征融合的方法,把以上三种方法提取的特征进行多特征融合并且对这些特征进行归一化处理,最后用支持向量机对笔迹特征进行分类。本文讨论了支持向量机分类的线性情形和非线性情形,通过合理选择核函数,有效设定松弛变量与惩罚因子,构造类与类间隔最大化的分类器,使支持向量机有较好的适应能力和分辨率。理论分析和实验结果验证了支持向量机在离线笔迹鉴别分类中的有效性。