论文部分内容阅读
在个人身份信息安全问题突显的今天,单模态生物特征下的身份认证技术因其自身的局限性,已经不能够满足人们的需要。利用多模态生物特征进行身份认证的技术已成为当今社会的研究热点。论文实现了说话人识别和人脸识别,并根据语音的信噪比和外界光照条件在决策层对说话人识别的结果和人脸识别的结果进行融合,以提高身份认证的正确率,从而弥补说话人识别和人脸识别对环境噪声和环境光照条件的不同要求。论文的主要工作如下:1、实现了说话人识别。采用基于高斯混合模型(Gaussian Mixture Model,GMM)的说话人识别方法,对不同说话人的训练语料经过预加重、分帧、加窗后,提取训练语料的梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)作为特征向量,训练得到每个说话人的声学模型,组成所有说话人的GMM模型库。在识别阶段,对输入的待识别说话人的语音信号,提取声学特征MFCC,并将特征向量与GMM模型库进行匹配,并根据匹配概率获得识别结果。实验结果表明,本文实现的说话人识别能够在纯净语音下达到92.8%的识别率。2、实现了人脸识别。采用GMM分类器进行人脸识别。在训练阶段,首先对人脸进行图像预处理,然后采用基于肤色人脸区域检测方法完成人脸检测,接着对人脸图像进行归一化,并采用基于主成分分析的特征提取算法提取人脸特征,最后根据特征训练得到每个人的GMM,从而生成GMM人脸模型库。识别阶段,对识别者的人脸图像经过人脸检测和特征提取后,将得到的人脸特征向量与GMM人脸模型库进行概率匹配,设定系统分类阈值后,获得识别结果。实验表明,本文实现的人脸识别能够在人脸图像高信噪比的条件下达到78.1%的识别率。3、实现了融合说话人识别和人脸识别的身份认证。采用决策层融合方法,将说话人识别和人脸识别的识别结果进行融合得到融合后的识别结果。设定了外界语音信号的信噪比阈值和图像亮度平均值阈值,采用分段式处理方法获得融合权重。当语音信号信噪比小于信噪比阈值,则身份认证依靠人脸识别完成;当外界图像亮度平均值小于亮度平均值阈值,则身份认证依靠说话人识别完成。实验结果表明,在高信噪比且良好光照的情况下,融合后的平均识别正确率比单独的说话人识别正确率提高了1.55%,比单独的人脸识别正确率提高了17.41%。在低信噪比且光照条件差的情况下融合后的平均识别正确率比单独人脸识别正确率提高了73.22%。