基于数据融合的脱机中文签名鉴别方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:qinxinhun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
脱机手写中文签名鉴别的主要困难就在于特征的提取,因此本文主要围绕如何提取能反映签名较本质的特征进行了相关研究。在具体解决签名鉴别时,一方面要考虑签名的静态特征,另一方面寻找动态特征,这也是本文重点研究的对象。提取静态特征时,在细化签名图像的基础上采用特征不变矩即伪Zernike不变矩来进行描述。动态特征方面提出了几个重要的特征,并且利用小波变换提取了一个重要的比例特征。另外在得到签名的外形以及高密区域并把它们进行结构性描述时,利用了矩阵的奇异值分解。在分类器设计方面,最初采用了简单的加权欧氏距离判别法,然后利用了BP (Back-Propagation)网络,之后提出了一个数据融合的混合实现方案。本文的主要创新点归纳如下:1、在签名图像预处理阶段,针对一般细化算法存在的问题,提出一个新的细化算法。此算法运算简单,能较好地解决转折笔划在细化时出现的分叉现象等。另外,在分析现有的连通区域检测算法的基础上,提出了一个新的八连通区域检测算法。此算法能很快提取签名图像中的连通区域以进行下一步的分析。另外在提取签名灰度图像及签名高密区域等方面都提出了新的可行方法。2、提出了一个新的基于特征不变矩及动态特征的签名鉴别方案。此方案为一个结合静态特征与动态特征的新的鉴别方法。提取静态特征时,利用伪Zernike矩的尺度及位移不变性,在细化的签名图像上计算10阶伪Zernike不变矩来组成特征向量。提取动态特征时,则首先从灰度图像得到签名的全局及局部高密区域,利用高密区域与原签名图像对应部分的面积之比得到全局和局部高密因素HDF (High-Density Factor)。另外在全局高密区域的基础上,计算其相对重心,并将其作为另一个特征。结合两类特征形成16维特征向量后,建立相应的鉴别系统。实验结果表明,系统的错误接受率FAR (False Acceptance Rate)和错误拒绝率FRR (False Rejection Rate)可以分别达到7.25%、9.30%。3、在前面研究的基础上,提出与一般小波变换应用不同的方法,利用了小波变换描述信号近似信息进而提取出签名的比例特征,并结合前面提出的有关特征,提出应用小波变换与特征不变矩相结合的方案进行脱机手写签名鉴别。利用小波变换时,对签名灰度图像计算加权归一直方图并进一步对此一维图像利用Daubechies(4)小波进行四阶二进离散小波分解,再重建第四阶近似系数。与通常的小波变换提取细节信息不同,本文提取的是近似信息。由此计算一个比例特征。另外再结合前面研究的结果采用加权欧氏距离法进行鉴别,实验结果表明FAR和FRR可分别达到7.83%、6.88%。4、利用BP神经网络作为分类器,将以上方案提取的特征组成特征向量作为网络输入,提出一个新的鉴别系统,实验结果表明了此系统的有效性。5、在前面研究的基础上,进一步提出了一个新的结合矩阵奇异值分解(SVD Singular Value Decomposition)的数据融合解决方案,即根据前面研究的基于小波变换和特征不变矩提取特征的BP网络以及在分析签名高密区域并利用SVD提取特征的BP网络,将两个网络的输出结果进行竞争选择得到最终的判别结果。并建立了相应的分类鉴别系统,即建立一个由两个分类器组成的分类系统。首先针对细化的签名二值图像与提取的高密区域细化图像分别进行奇异值分解,得到一个40维特征向量。然后建立针对同类签名的BP网络,对此网络进行训练并对测试样本鉴别得到一组输出结果。另外对基于小波变换和特征不变矩的分类鉴别系统进行训练,并对测试样本鉴别得到另一组输出结果。最后将两个系统的结果竞争选择输出从而得到最终的鉴别结果。实验结果表明此方案比任两个单独的系统在鉴别性能上有进一步的提高,FAR和FRR分别能达到5.71%和6.25%。
其他文献
随着多媒体技术的快速发展,视频数据大量地增加,基于内容的视频检索的应用越来越广泛,而关键帧提取技术是视频分析和基于内容的视频检索的基础。一个镜头的关键帧就是反映该镜头
随着电子商务的发展,电子支付安全问题已成为人们日益关注的热点。常用的电子支付的协议有SSL协议和SET协议。基于SSL协议的电子支付系统成本低、应用简单透明、相对简单且快
Google Scholar为我们搜索各种来源的学术文献信息提供了一个简单易用的平台。它使用网络爬虫来把各种来源的文献信息集中存储到Google自己的数据库里,然后通过web向用户提供
自从全基因组测序成为可能以来,基因组结构注释(包括了解基因组DNA中的基因组成、结构及其调控元件)成为生物信息学研究的重要问题,由于基因组结构注释系统的计算量庞大,需要
当前核酸、蛋白质数据呈几何级数增长,如何从海量数据中获取有效信息成为生物信息学迫切需要解决的问题。数据挖掘技术就是从大量的数据中挖掘出有用的或者人们感兴趣的知识的
随着互联网技术的发展,存储于Web里的信息急剧膨胀,这些信息包括文本信息、声音信息、图像信息等,其中文本信息存储和传输技术相对比较简单,易于上传和下载,因此大部分信息以文本
支持向量机是在统计学习理论的基础上发展起来的新一代学习算法,该算法在机器学习、模式识别等领域都取得了很好的应用。但随着需要处理的数据量不断增大,支持向量机表现出计
学位
随着 EPA 标准的逐步推广应用,国内有很多厂商正在从事 EPA 产品的开发工作。为检查各个不同生产厂家的实现是否与 EPA 标准相一致,并保证不同实现版本之间能够完全地相互访问
随着 Internet、无线通讯技术的迅速发展, VoWLAN(Voice over WirelessLocal Area Network)业务超过传统语音业务已成为一个不可避免的趋势,其业务将逐步从以传统语音业务为主