基于流形学习的数据降维方法及其在人脸识别中的应用

被引量 : 44次 | 上传用户:bcdagjcly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着科学技术的发展,人们对于各种数据的获取较之以往更为方便和普遍。然而,在很多实际应用问题中,我们所采集到的数据往往具有高维数、非线性等特征。这些特征一方面导致了“维数灾难”现象的出现,另一方面,不利于人们直接理解及发现数据集所蕴含的内在规律。因此,利用降维技术对高维数据进行处理就显得尤为重要。传统的降维方法(例如主成分分析、独立成分分析、线性判别分析等)能够有效地处理具有线性结构和高斯分布的数据集。但当数据集具有非线性结构时,这些方法却难以发现隐藏在高维数据中的内在低维信息。基于流形学习的数据降维方法假设高维观测数据位于嵌入到高维欧式空间的低维流形上,因此可以有效地发现和保持在高维空间中呈现高度扭曲数据集的内在几何结构。目前,流形学习算法已经成为了数据挖掘、模式识别、统计机器学习等相关领域研究的热点。本文对基于流形学习的数据降维方法进行了深入地研究,提出了3种基于流形学习的数据降维和特征提取方法,并将其应用于具体的人脸识别问题中。通过仿真实验和与其它算法的比较,验证了文中算法的有效性。主要工作和创新成果集中在以下几个方面:1、对现有的线性及非线性降维算法进行总结,并对流形学习的定义、研究现状、应用领域进行介绍。通过对人脸识别技术的分析,指出了将流形学习应用于人脸识别问题的合理性和可行性。2、为了解决传统主成分分析(PCA)算法无法应用于非线性结构数据的缺点,提出了一种基于局部PCA和低维坐标排列的流形学习算法。在本方法中,首先利用测地线距离的约束和最小集覆盖方法将数据所在的整体非线性流形划分成若干个互相重叠的最大线性贴片(Maximum Linear Patch,MLP)。由于得到的每个最大线性贴片所包含的数据具有线性结构,因此,我们可以利用传统的主成分分析(PCA)方法对每个最大线性贴片中的数据进行降维,得到其局部低维坐标。最后,将坐标排列(alignment)技术和最大间隔准则(Maximum Margin Criterion)结合,对所有最大线性贴片的局部低维坐标进行排列,得到整体数据集的全局降维结果。由于本方法在降维的过程中同时考虑到了数据的流形结构和类别信息,因此,在人脸识别的实验中取得了较好的结果。3、提出了一种自适应加权的子模式局部保持投影算法(Aw-SpLPP)。与传统的局部保持投影(LPP)算法不同,Aw-SpLPP首先将输入的高维原始数据划分成若干个子模式,然后利用LPP算法对得到的每个子模式集合分别进行降维,得到可以保持各个子模式集合局部结构的低维特征。此外,为了增强算法的鲁棒性,采用一种自适应的方法计算每个子模式对于识别的权重。通过将Aw-SpLPP算法应用于人脸识别问题,可以看出该方法不仅能够提高传统LPP的计算效率,在识别的准确率方面也要优于其它的子模式算法。4、提出了一种结构保持的投影算法(SPP)。在本方法中,我们同样将原始高维数据划分成若干个子模式。但与前面提到的Aw-SpLPP和其它基于子模式的方法不同,SPP在对每个子模式进行降维的过程中,不仅考虑到了它所在子模式集合的流形结构,还考虑到了它与来自于同一样本的其它子模式之间的关系。通过SPP算法,我们可以在保持各个子模式集合的非线性流形结构的同时保持每个输入样本内在结构。与前面提到的两种基于流形学习的降维算法相同,我们将SPP算法应用于人脸识别问题并在标准人脸数据库上验证了算法的有效性。从实验结果可以看出,SPP算法要优于其它全局和局部识别方法。
其他文献
灵性就是精神,灵性需求是人与生俱来的本能;灵性与人的躯体、心理和社会因素构成了全人的概念。灵性痛苦广泛存在于人群中,灵性痛苦的识别、评估与照顾离不开同理心的运用,晚
目的:探讨急性心肌梗死合并心肺骤停护理措施,并分析其预防多脏器衰竭的临床价值。方法选择患者80例,分为两组,各40例,观察组实施本研究护理干预方法,对照组则实施常规护理,比较两组
ITS中的一个重要研究领域就是交通流的诱导 ,而为了要正确地诱导交通流 ,就需要对交通流的状况进行实时分析和预测。本文运用计算机科学领域中的数据挖掘技术 ,提出了一个城
基于中职学生的共同兴趣、爱好组建学生社团。在指导教师的导引下,让中职生在社团活动中,亲自组织、策划、参与,实现自我管理、自我服务、自我教育、自我提高,全面提升个人素
根据热力学基本原理,提出了石灰石石膏湿法烟气脱硫吸收塔出口烟气温度及蒸发水量的计算过程。计算采用典型FGD入口烟气参数,应用烟气湿度和定压容积热容的概念计算了吸收塔
随着移动通信技术的发展,用户业务量和数据吞吐量不断增加,第三代移动通信系统已不能完全满足用户的需求。因此,3GPP致力于研究3GPP LTE (Long Term Evolution)作为3G系统的
基础地理信息数据库是数字城市的基础和框架,本文以吉林省基础地理信息数据库的建设为例,阐述了该项目实施的技术路线、入库流程、以及数据库系统功能等项内容,最后对数据库
中国大学生创业教育发展与国外相比存在较大差距,主要的问题凸显在创业教育的培养目标、课程培养体系、师资队伍、课外实践环节、外部支撑环境和制度保障等方面,在对比分析上
佛山市顺德区碧桂路南国路立交工程地处珠三角腹地,工程地质及水文地质情况极为复杂,主体工程为碧桂路下穿地道,其设计和施工难度都很大。结合地道工程施工图设计方案和现场