论文部分内容阅读
随着科学技术的迅猛发展,高维数据愈来愈多。包含在这些高维数据里的噪音信息以及数据表现出的统计特征的多样性和复杂性,致使对高维数据的分析与处理面临极大的挑战。迄今为止,机器学习领域已提出大量的降维算法。这些算法动机不同,但目标相似,都是为了得到数据的低维表示以提高数据处理效率、降低模型复杂度、消除噪音影响等。降维方法主要有两类,一类是线性降维方法,该方法能够有效处理线性结构的数据集,但是当数据集具有非线性的结构时,则很难找到隐藏在这些数据中的低维信息。另外一类是非线性降维方法,如流形学习、核方法、人工神经网络等。流形学习作为非线性降维方法的一个重要分支,出现于本世纪初。流形学习因能够有效发现和保持高维数据集的内在几何结构而备受关注,尽管出现较晚,但是流形学习发展很快,并已广泛地应用到人脸识别、数据可视化等众多领域。本文对流形学习继续深入研究,提出了两个基于流形学习的数据降维方法,将其应用到人脸识别中,通过实验和与其他算法的比较,证明了新算法的有效性。本文的主要工作如下:1.对基于流形学习的降维算法进行分析和研究;2.将监督信息引入受限最大方差映射(CMVM),提出了一种有监督的受限最大方差映射算法(SCMVM)。利用局部流形上的样本的距离信息和类别信息,定义一个新的关系权重表示,将这个关系权加入到算法中有效提高了算法的模式识别性能;3.提出了含有惩罚参数的有监督受限最大方差映射算法(PSCMVM)。本算法借鉴局部保持映射(LPP)算法中的惩罚函数的思想,在降维映射过程中增加了抑制局部结构变化的折衷惩罚,达到局部保持的流形正则化目的。