汉字笔迹鉴别的算法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:heephy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着生物识别技术的迅速发展,计算机笔迹鉴别逐渐成为不可或缺的重要组成部分,就像语音、指纹、虹膜和人脸等生物特征识别技术一样。它是通过比对、分析不同人书写的相同单字(特征字)或整体书写风格来判断书写人身份的一门技术,广泛应用在金融、保险、公安司法部门的刑事调查和法庭审判领域,具有鉴别快、效率高、不受文检人员主观因素的影响等特点。因此为了避免笔迹鉴别专家的主观人为因素的影响,实现笔迹鉴别的自动化和智能化,使笔迹鉴别结果更客观,成为该领域中的重要研究目标。本文主要针对离线手写体汉字笔迹鉴别方法展开研究,重点主要集中在笔迹图像预处理和特征提取部分。研究目的主要是为汉字笔迹鉴别中涉及到的各种主要算法和技术进行有效性分析和实现,为计算机笔迹鉴别系统的实现提供技术支持,推动笔迹鉴别自动化的进程。文中首先介绍了笔迹鉴别的应用背景和发展历史及笔迹鉴别研究的技术现状,针对该研究领域的性质和实现的难点,采用图像处理与模式识别领域中的前沿理论算法,提出了一个实现汉字笔迹鉴别系统的方案。纹理分析是在图像处理、分析和识别中广泛应用的一种方法,文中总结了几十年来研究者们提出的许多纹理分析的方法。其中Gabor变换是现代信号处理中一种重要的联合时频分析方法,又称短时或加窗Fourier变换,与传统的Fourier变换相比,它在频域内具有很好的时域分辨能力,良好的时频局部化、方向特征以及多分辨分析的小波特性,在Heisenberg测不准原理下,它被证明具有最优的联合时频分辨率。同时,通过对人的感知系统的生理学特性研究表明,二维Gabor基函数能够很好的描述哺乳动物初级视觉系统中大多数简单视觉神经元的感知域特性。针对自由格式的手写体汉字,提出一套系统完整的笔迹图像预处理算法,其中我们将不同人写字宽度的统计特性与高斯分布的特性结合进行粘连字的滤除,然后根据粘连字的投影图中波谷点的位置,选择某一阈值作为最佳切分点将其分割开来,从而很容易实现了字符大小的归一化、汉字的任意拼接和行倾斜的校正。该算法使得整个预处理子系统更加稳定与完善,为后续的笔迹鉴别提供了可靠的保证。在基于多通道Gabor滤波器的特征提取中,提出一种基于人眼主观视觉特性与汉字笔画宽度的统计特性相结合的高鲁棒性方法,将其运用到笔迹图像的特征提取中,并与传统的实验法作了比较。最后对49个人的手写体汉字笔迹的测试表明,该文中所提出的算法可以获得优异的识别性能,能够使得正确识别率最高达到98%以上。另外,采用基于最新统计学习方法的支持向量机分类器进行多类分类时,对多项式核函数、径向基核函数、Sigmoid型核函数三种核函数进行了对比,实验表明在采用相同训练样本数和测试样本数的情况下,采用径向基核函数能够取得更高的正确识别率。
其他文献
本文首先全面介绍了第三代短波自动链路建立系统,并对其自动链路建立(ALE)协议和业务管理(TM)协议的工作机制作了简要描述。重点讨论了数据传输协议体系的设计和实现。数据传
本文根据保定市及各县供电公司自动化信息管理现状,提出了基于J2EE平台的Web系统开发。采用MVC模式和Struts框架,将系统分为视图层、控制层、模型层三个层次,并逐层实现,完成
随着多媒体服务与应用中对更高数据传输速率需求的不断增加,下一代移动通信网络预期需要提供更高的比特传输速率。日益明显的趋势让运营商寻找新的方式提升网络覆盖与网络容量
中断连续波雷达在未来的高技术战争条件下,具有广阔的应用前景,它以其固有的优点,近年来倍受世界各国的青睐,成为雷达技术研究领域的热点。国内对于伪随机码调相中断连续波雷达的
电力线用来作为通信媒介已成为现实,只要铺设电力线的地方,就可以进行高速数据传输。用电力线上网是通信技术发展的趋势,也是通信技术多样化,现代化的要求。本文介绍了宽带电
误码仪是在通信系统的性能测试以及故障诊断中必不可少的设备。传统的误码仪基于CPLD和CPU协同工作,结构复杂,价格昂贵,而且不方便携带,随着现代EDA设计技术的进步,越来越多
计算机网上阅卷作为近年来我国考试领域的重大改革,受到社会的广泛关注,但也存在一些问题尚需解决。目前,评卷管理都采用基于密码管理的模式,但当个人密钥丢失后存在身份无法认证
近年来,随着物联网的快速发展,RFID技术被广泛应用在零售业、物流业、制造业、医疗行业和信息产业等领域中。为了满足RFID技术的实际应用需求,必须要搭建一套高性能的RFID实
为了迎接WiMAX等移动宽带无线接入技术市场的挑战,2004年3GPP启动了UMTS标准的长期演进版本-LTE。2008年3GPP开始了面向LTE的平滑演进LTE-A技术的研究。LTE-A引入了多个关键技
随着人机交互系统的快速发展,语音情感识别近年来越来越受到人们的重视。包含在语音信号中的情感情息是一种很重要的信息资源,它是人们感知事物的必不可少的部分信息。例如同