论文部分内容阅读
随着科技时代的到来,科技竞争的程度日益加强。为了提高科技的创新环境,国内外都加大了对科技的投入,人脸识别技术在此机遇下也快速发展。由于该技术的广泛应用,使得人们对于自身的信息安全问题和国家的信息安全问题都有了更高的重视。在实际的应用中对人脸进行特征提取时会受到光照、位势、遮挡物等多种因素的影响,因此使得提取的人脸特征无法详细的表示出人脸,从而对人脸的识别性能产生了一定的影响。稀疏分类本质上是把训练样本直接作为字典对给定的测试样本进行稀疏表示,在训练样本较小时字典对测试样本的表示能力较弱。如果通过增加足够的训练样本来增强字典的表征能力会增加求解系数的复杂度,因此为了增强字典的判别能力提出了字典学习的方法。在人脸识别的过程中分类器的分类性能是决定识别率的一个重要因素,除此之外如何使得提取的人脸特征具有较强的判别信息和表征能力也是非常重要的。在本文中针对如何提取出具有较强判别信息的字典和字典学习方面的问题进行了研究,主要进行了以下两方面的工作:把样本空间中低维数据经过合适的核函数非线性映射到高维的特征空间中,可以增强数据的线性可分性。不同的核函数有不同的特性,针对不同的人脸数据库有不同的映射效果,而且核函数参数的选择也是根据经验来设置的,至今也没有完善的理论依据。针对以上的不足,在本文中提出了基于Power核的多核稀疏分类的人脸识别算法。Power核函数是三角核函数的一种,具有较强的稳定性,高斯核函数具有一定的实用性只要参数选择合适,大部分样本通过映射得到的特征空间都能够被很好的线性分开。基于以上这两个核函数的优点将其线性的复合在一块,并在ORL和Yale等人脸数据库上进行测试,同时和高斯核、线性核、二阶多项式核函数下核稀疏分类算法相比较。基于Fisher判别的字典学习算法主要是通过最小化类内离散度和最大化类间离散度的方式来获得具有较强判别能力的字典,但是该字典学习算法中没有将这两方面充分的结合在一块。针对以上算法的不足,在本文中提出了一个基于多重最大尺度不同的字典学习算法。该算法通过对类内离散度和类间离散度进行参数约束,通过调控类内离散度和类间离散度的贡献能力从而使最小化类内离散度和最大化类间离散度的性能达到最高,进而使得通过多重最大尺度不同的字典学习方式得到的字典具有更强的判别能力。为了对算法进行识别性能的测试,将本文中的提出算法在AR和Yale扩展人脸库B上进行识别性能的测试,并与稀疏分类算法[2]和基于Fisher判别的字典学习算法进行比较,实验结果表明本文提出的算法具有良好的识别性能。