论文部分内容阅读
随着人类社会经济的发展和基础科学研究的进步,智能信息技术在人类的日常生活中扮演着越来越重要的角色,由此带来的个人信息安全问题受到了整个社会的高度重视。签名作为一种历史悠久的身份认证方式具有广泛的用户基础,随着电子签名的不断普及,在线签名认证技术开始受到人们的关注。目前在线签名认证领域主要存在以下三个问题:第一,公开数据库中的中文签名样本稀少,不利于中文在线签名认证算法的研究,并且现有数据库中多模态和跨时段的签名数据缺乏,难以评估不同的采集设备和采集时间段对用户签名行为习惯的影响;第二,传统的基于动态时间规划算法(Dynamic Time Warping,DTW)的签名认证系统依赖大量的特征描述算子,存在算法复杂度高的问题,难以在实际场景下进行快速的部署和使用;第三,传统的特征描述算子表征能力具有一定的局限性,导致算法的泛化性能较差,无法适应不同的签名数据库。针对在线签名数据库,本文构建了一个多模态的中文在线签名数据库(Multimodal Signature Database at South China University of Technology,SCUT-MMSIG),包括手机、手写板和空中签名三种模态。整个数据库由50个用户组成,共包含6000个在线签名样本,其中每个用户包含20个真实的在线签名样本和20个熟练的伪造签名样本。数据库中真实签名的采集由两个间隔在一个月以上的时间段组成,充分考虑了时间推移引起的签名数据质量变化对在线签名认证算法的影响。针对在线签名认证算法,基于传统方法和深度学习方法,本文分别提出了一个基于多距离融合的DTW算法(Multi-Distance Based DTW,MDB-DTW)和一个双通道深度神经网络模型,前者通过融合七种不同距离度量的信息,在精简所需特征描述算子数量的基础上,有效提升了算法对在线签名的特征提取能力,相关的实验进一步证明了MDB-DTW算法的鲁棒性和实用性;为了缓解人工特征算子的局限性,提升算法的泛化性能,后者探索了如何使用深度学习方式对在线签名的静态结构特征和离散时序特征进行自动提取。其中,第一个通道将原始的在线签名认证问题转换为自然语言处理领域的文本匹配问题,通过构造两个签名序列的相似度矩阵,使用多层卷积神经网络来提取签名样本的结构特征;第二个通道使用带有自注意力机制的双向长短期记忆网络,通过挖掘签名序列内部的前后依赖关系,对签名的时序特征进行提取。通过对两个通道的消融实验分析和对网络结构的可视化分析,本文证明了所提出的深度网络模型能够自动的关注签名中的关键部位,同时所提取的结构特征和时序特征具有良好的互补性,能够共同提升模型的认证精度和泛化性能。最后,通过对SCUT-MMSIG数据库中不同模态和不同时间段的签名进行深入分析,本文发现书写区域的限制以及时间的推移会在很大程度上影响用户的签名行为,从而降低在线签名认证系统的精度。此外,本文使用自建的SCUT-MMSIG以及四个公开的在线签名数据库MCYT-100、SUSIG、Biosecue ID和MOBISIG进行算法的对比实验,在和现有公开文献提及方法的比较中,本文发现MDB-DTW能够进一步提升传统方法的认证精度;而双通道深度神经网络模型仅需一个参考签名样本就能够在上述五个数据库上全部达到目前最优的认证精度,充分证明了本文所提出的方法具有较好的泛化性和实际应用价值。相关的数据库和算法代码均在Github进行开源,以供研究人员进行进一步的学习和使用。