论文部分内容阅读
随着科技的发展,信息往往伴随着高维数据出现,由于人们直观的认知仅局限于三维以内,从而维数约简成为必不可少的分析方法,作为目前处理高维数据最有效的方法,以往的线性降维方法,不能将高维数据的非线性表示出来,流形学习是一种非线性降维方法,保持数据在高维流形中的某种特性,映射到低维流形。人脸识别依旧目前是研究的热点之一,人脸图像所在的空间,存在不可预知性,所有的模型只能逼近其空间特性,而流形方法通过学习其真实的空间某种特性,更好的表示其空间几何特性,比欧式空间的数学模型,其推理更加严谨。其学习的特性主要包括其全局特性和局部特性,但流形方法存在一些如参数设定,计算量优化的问题,本文主要解决其非监督的局限性。本文主要贡献:1.等距映射(Isometric Mapping,简称ISOMAP)是一种非监督的流形算法,对于有先验类别信息的数据,不能充分使用其类别信息,其改进算法Extended ISOMAP使用结合线性鉴别分析(Linear Discriminant Analysis,简称LDA)方法,但由于LDA是线性分类方法,对于数据内部的非线性不能很好的表现,本文通过引入自适应距离因子,从另一种思路,利用先验的类别信息,达到非线性分类的效果,实验表明,其效果显著。在此基础上,针对其不能达到实时性这一缺点,结合推广的等距映射算法,改进对新加入样本求低维嵌入的方法,克服了这一缺点。2.传统的局部线性嵌入(Locally Linear Embedding,简称LLE)算法对于其近邻点的选择方法比较简单,对于已知先验知识的高维数据,降维效果欠佳,本文考虑到其与类中心的邻接关系,提出一种分层选取其近邻点的LLE方法,从而达到选择合适近邻点的目的,实验表明,这种方法比较有效。