论文部分内容阅读
流形学习自2000年提出以来,一直备受研究人员的关注。在流形学习中,人们假设样本是均匀采样于一个高维空间中的低维流形。在此假设基础上,流形学习的目的就是找到高维采样数据内在的低维流形结构,并求出相应的低维嵌入,来实现维数约减或者数据的可视化。流形学习的主要方法有局部线性嵌入、等距映射、拉普拉斯特征映射等。本文主要研究的是局部线性嵌入流形学习方法,对该方法中邻域选取和表示问题进行了研究。引入正交匹配追踪算法(OMP)在选好的近邻中再做二次选择,从而对局部线性嵌入方法进行改进。提出了基于OMP的局部线性嵌入流形学习算法,使得样本能够用同一流形上的点来线性表示。在UCI和手写体数字上的实验结果证实了该方法能够提高降维后数据的可分性。提出了基于OMP的局部线性嵌入增量学习算法,该方法在处理新增样本时,用已知样本来线性表示新增样本,线性表示的系数由OMP方法求解。该增量方法在UCI、手写体和人脸数据集上的实验结果表明降维后测试集具有更高的识别率。提出了基于OMP的有监督局部线性嵌入算法,样本用同类样本线性表示。同样在UCI、手写体和人脸数据集上进行实验,实验验证了利用类别信息后分类效果更佳。本文提出的三个算法的实验结果都表明引入OMP算法的有效性。