基于稀疏表示与鉴别分析算法的人脸图像分类研究

来源 :南京理工大学 | 被引量 : 2次 | 上传用户:gameryufei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸识别技术是生物识别领域的一个重要分支,人类面部的高维数据信息足以支撑有效的个人身份验证。因此近几十年来,针对人脸信息的研究和应用层出不穷。相继提出了一系列不同的特征提取和分类算法,并取得了良好的效果。本文以二维人脸图像作为研究对象,对线性鉴别分析和基于稀疏表示的分类(Sparse Representation-based Classification,SRC)框架算法进行相关研究。在SRC框架中,人脸图像被直接当作字典,测试样本被表示为所有训练样本的线性组合。理想的分解系数是:真实类别的分解系数非零而其余类别的系数都为零。但是由于面部图像组成的字典并不严格满足稀疏分解的条件,再加上人脸对齐、采样误差和噪声等等因素的影响,得到的分解系数并不是严格稀疏的。所以字典的优化、分解系数计算方式的改变以及字典的淘汰策略都是本文研究的方向和重点。此外,通过深入研究线性鉴别分析(Linear Discriminant Analysis,LDA)的框架,我们发现在原始的模糊鉴别分析算法的散布矩阵定义的步骤中,每一个样本的隶属度信息对于散布矩阵所做的贡献并没有被体现出来。针对此情况,将每一个样本的隶属度,根据它对散布矩阵重定义所做的贡献重新融入到特征抽取的过程中,从而得到了完整有效的模糊样本特征向量集。本文取得的主要研究成果和创新点包括:(1)将层次多尺度局部模式特征(Local Binary Patterns,LBP)和类别剔除策略引入SRC框架,并且在稀疏系数分解的过程中使用贪婪搜索的方法获得解空间。原始的SRC框架将人脸图像直接用作训练字典,并没有使用特征向量代替原始的人脸图像的特征。局部特征(Local Patterns)因为其计算的简便性和处理的有效性,一直都被用于纹理分类中,在这里我们首先提取原始人脸图像的层次多尺度的LBP特征,相比较于传统的LBP特征,层次多尺度的LBP特征充分挖掘非均匀的二值化模式,试图寻找面部特征更多的鉴别性信息。此外,我们还设计了迭代循环剔除类别的方式,来确定最终的线性表示的系数,旨在找到最优的线性组合来重构测试样本并完成分类。在ORL、FERET和AR三个人脸数据库上,提出算法的识别率可比其余的基于表示的分类算法至少提高2个百分点,进而验证了算法的有效性。(2)在SRC的分类框架中,通过构造虚拟样本的方式来获得额外的训练样本,并提高分类精度。在本文中使用的三种构造虚拟训练样本的方式:原始训练样本的镜像文件、原始训练样本间的加权平均样本以及三维形变模型生成的虚拟样本。在虚拟样本中,使用局部算子获得图像的层次多尺度的局部特征描述,为了加快计算速度和减少特征向量的维数,使用主成分分析(Principal Component Analysis,PCA)的方法对特征向量做降维处理。虚拟样本可以模拟真实样本的可能的变化和趋势,但是并不能保证所有样本都会对最终的分类起到积极的作用,所以在评价每个类别的样本在重构测试样本的能力的时候,首先剔除一部分距离测试样本较远的离群样本。这样才能突出真实类别的样本的贡献程度,保证分类的质量。相比较于迭代循环剔除类别的方式,我们设计了一次性剔除若干训练样本的方式,在提高运算速度的同时仍可以保留一定比例的原始和虚拟混合训练样本来线性表示测试样本。在实验部分,通过对比加入虚拟样本和不加入虚拟样本的结果,印证了虚拟样本的有效性。(3)扩展局部二值模式(Local Binary Patterns,LBP)到广义的多尺度局部量化模式(Local Quantized Patterns,LQP)来提取图像的特征,并应用在SRC的分类框架中。二值局部模式的编码方式严重限制了可以使用的模式的形状和尺寸,并且依赖于非常粗糙的定性灰度值进行比较。在LQP中,通过改变不同的形状和引入更多的像素,使得局部特征更加有效。在这里,我们将人脸图像分成高分辨率、中分辨率和低分辨率三个尺度,并在每个尺度中提取LQP特征,替代原始的人脸图像,作为SRC框架中的样本字典。(4)在处理彩色图像的时候,使用四元数的方式来存储和表示彩色像素的RGB值,四元数可以将彩色像素的三个分量简单地表示为一个“数”的形式,进而彩色图像可以被表示为四元数矩阵的形式参与运算。本文采用线性判别分析的算法,将四元数矩阵变换到低维四元数子空间,并且在这个低维空间中进行分类。传统的针对彩色图像的处理方法是处理灰度图像或是将RGB彩色图像转化为HIS颜色空间而只处理强度信息。当然也可以将彩色图像分别在各个颜色通道中分别作处理并融合最终的结果。在我们的试验中,在GT彩色数据库中12个训练样本的情况下,我们的四元数LDA的方法的识别率达到80.7%。(5)提出一种改进的模糊监督学习算法。与传统的模糊LDA方法相比,所提方法计算出与每个训练样本分类隶属度相关联的鉴别矢量,这在理论上有效地减少了每个样本不精确的分类评价所带来的分类错误。与此同时,我们对该模型利用核方法进行非线性判别信息的提取,进一步解决了非线性分类问题。从而将改进的核模糊LDA算法作为监督学习的工具。
其他文献
对220 kV高压电缆隧道敷设所遇到的困难因素进行了分析,并提出了有效的解决办法和方案。
目的:明确人参皂苷Rg1在大鼠发生急性心肌梗死后是否能够促进心脏血管新生。方法:通过结扎SD大鼠左冠状动脉前降支建立大鼠急性心肌梗死模型,并将60只雄性SD大鼠随机分单纯手
中化兴中石油转运(舟山)有限公司作为商业运作单位,中转的油品复杂多样,为适应市场需求,公司经营从各种低凝点,低粘度的原油到高凝点、高粘度的原油、重质燃料油的方向发展,
期刊
党内民主问题不仅仅是个理论问题,更是一个实践课题。中国共产党的党内民主建设经历了艰辛的探索历程,积累了丰富的经验。回顾和总结建党以来党内民主建设的发展轨迹和历史经
回顾过去,中国援外70年的历史进程可以分为无产阶级国际主义主导时期、平等互利四项原则主导时期和弘义融利的义利观主导时期。坚持党的领导、满足国家和人类社会的发展需要
土地是我们人类生存和发展的基础,是最为重要的自然资源和环境要素。随着全球人口的不断增长,人类对地球表层进行了广泛而深刻的改造,人类活动给养育生命的土地造成了巨大的
随着经济迅速发展,企业数量逐渐增加,市场竞争也越来越激烈,提高企业的市场竞争力已经成为当前企业发展的重点。内部控制是提升企业竞争力的有效手段,企业需要加强内部控制制
通过化学解聚的方法可以实现废PET的完全回收再利用,本文简要介绍了PET聚酯的化学解聚原理以及到目前为止取得研究成果的几种主要的解聚方法。
扬州作为南水北调东线取水源头的城市,自觉打造清水廊道.护佑一江清水北上,率先启动江淮生态大走廊规划建设。本文阐述了江淮生态大走廊之扬州北潮湿地公园生态景观规划设计方案
铁路警务、轨道警务、空域警务、水域警务等皆属交通运输警务之范畴,欲发展交通运输警务专业教育,需先建构其基本理论框架。首先,应辨析交通运输的基本概念和产业特征,如交通