论文部分内容阅读
近年来,随着生物识别技术的迅速发展,计算机笔迹鉴别逐渐成为不可或缺的重要组成部分,就像语音、指纹、虹膜和人脸等生物特征识别技术一样。它是通过比对、分析不同人书写的相同单字(特征字)或整体书写风格来判断书写人身份的一门技术,广泛应用在金融、保险、公安司法部门的刑事调查和法庭审判领域,具有鉴别快、效率高、不受文检人员主观因素的影响等特点。因此为了避免笔迹鉴别专家的主观人为因素的影响,实现笔迹鉴别的自动化和智能化,使笔迹鉴别结果更客观,成为该领域中的重要研究目标。本文主要针对离线手写体汉字笔迹鉴别方法展开研究,重点主要集中在笔迹图像预处理和特征提取部分。研究目的主要是为汉字笔迹鉴别中涉及到的各种主要算法和技术进行有效性分析和实现,为计算机笔迹鉴别系统的实现提供技术支持,推动笔迹鉴别自动化的进程。文中首先介绍了笔迹鉴别的应用背景和发展历史及笔迹鉴别研究的技术现状,针对该研究领域的性质和实现的难点,采用图像处理与模式识别领域中的前沿理论算法,提出了一个实现汉字笔迹鉴别系统的方案。纹理分析是在图像处理、分析和识别中广泛应用的一种方法,文中总结了几十年来研究者们提出的许多纹理分析的方法。其中Gabor变换是现代信号处理中一种重要的联合时频分析方法,又称短时或加窗Fourier变换,与传统的Fourier变换相比,它在频域内具有很好的时域分辨能力,良好的时频局部化、方向特征以及多分辨分析的小波特性,在Heisenberg测不准原理下,它被证明具有最优的联合时频分辨率。同时,通过对人的感知系统的生理学特性研究表明,二维Gabor基函数能够很好的描述哺乳动物初级视觉系统中大多数简单视觉神经元的感知域特性。针对自由格式的手写体汉字,提出一套系统完整的笔迹图像预处理算法,其中我们将不同人写字宽度的统计特性与高斯分布的特性结合进行粘连字的滤除,然后根据粘连字的投影图中波谷点的位置,选择某一阈值作为最佳切分点将其分割开来,从而很容易实现了字符大小的归一化、汉字的任意拼接和行倾斜的校正。该算法使得整个预处理子系统更加稳定与完善,为后续的笔迹鉴别提供了可靠的保证。在基于多通道Gabor滤波器的特征提取中,提出一种基于人眼主观视觉特性与汉字笔画宽度的统计特性相结合的高鲁棒性方法,将其运用到笔迹图像的特征提取中,并与传统的实验法作了比较。最后对49个人的手写体汉字笔迹的测试表明,该文中所提出的算法可以获得优异的识别性能,能够使得正确识别率最高达到98%以上。另外,采用基于最新统计学习方法的支持向量机分类器进行多类分类时,对多项式核函数、径向基核函数、Sigmoid型核函数三种核函数进行了对比,实验表明在采用相同训练样本数和测试样本数的情况下,采用径向基核函数能够取得更高的正确识别率。