论文部分内容阅读
现今信息时代中,文字、声音、图像等几乎所有的信息载体均以高维非结构化数据的形式进行存储、处理和传输。但是,高维数据难以直接被现有的机器学习、数据挖掘和数据分析算法有效的处理。如何在海量繁杂的高维数据中找出影响其变化或分布的潜在关键因素是信息科学领域中的基本问题。数据降维是解决这类问题的主要技术手段,包括线性降维和非线性降维两类方法。由于现实数据的分布往往具有非线性的特点,线性降维方法在实际应用中受到了很大的限制。因此,非线性降维方法成为解决这类问题的主要方法,在机器学习、计算机视觉、数据挖掘和图像分析等众多领域得到了广泛的研究,是该领域的研究热点之一。目前,数据的非线性降维方法主要包括基于神经网络的方法、基于核函数的方法和流形学习方法。其中,流形学习方法因其具有清晰的几何解释和生物学依据吸引了广泛的关注。但是,现阶段流形学习方法仍处于理论研究阶段,存在着许多问题阻碍着其实际应用。本文重点针对流形学习方法中的邻域选择、嵌入方法和高维数据预处理等关键问题,开展理论方法和仿真实验研究。首先通过算法解析现有流形学习方法如Isomap、LLE、LTSA等的优缺点,以及在人脸识别与头部姿态估计和人体三维步态捕获问题中的应用。根据计算机视觉中人脸识别与头部姿态估计两者相互作用的现象,通过使用近邻图构建覆盖,定义点到流形的距离等方法和手段,提出一种对于人脸识别与头部姿势估计问题的整体解决方案,并通过对FacePix数据集的仿真实验验证了方法的有效性。基于流形反映运动变化规律这一特性,利用Isomap方法找出像素空间和人体骨架点空间中的低维步态流形,采用广义回归神经网络建立图像、步态流形、人体骨架点之间的映射关系,达到从图像中获取人体三维步态信息的目的,并采用Weizamann人体行为数据库和卡内基梅隆大学运动捕捉数据库,通过实验验证了方法的有效性。其次,分析降维效果的评价指标和现有邻域选取方法的缺陷。针对目前邻域选取方法存在的短路现象和曲率差异过大等问题,使用奇异值分解、余弦定理等数学工具,通过分析合理邻域的特性,提出两种基于流形曲率变化的自适应最大线性邻域选择方法,即基于法空间夹角的邻域选择方法和基于数据点分布的邻域选择方法。进一步地,针对经典流形学习方法对于邻域参数选取敏感的问题,以Isomap和LLE两种方法为例,提出了改进算法,通过使用最大线性邻域替代固定邻域,并在目标函数中引入权重,以提升降维效果和降维鲁棒性。另外,基于微分几何中流形的定义,提出了一种基于图集相容性转换的流形学习方法。通过分析‘图集’和‘相容性条件’,及其在散乱点云数据中的物理意义,使用PCA和仿射变换等数学方法,构建最小化邻域交集点嵌入坐标误差的目标函数,将其转化为带约束的极值问题。采用拉格朗日乘子法研究该问题的广义特征向量求解方法,并给出增量学习和重构问题的解决方案。通过在散乱点云数据集、Isomap人脸图像数据集和LLE人脸图像数据集上的降维和重构实验,验证了该方法的有效性。最后,针对高维数据集中的噪声和数据点分布不均匀情况下,会导致流形降维误差增大的问题,对含有不同强度噪声和不同稀疏度的数据集的降维结果进行了分析。提出了去除噪声和数据插值的预处理方法,使用线性投影、坐标系变换、快速凸包算法等手段,去除噪声并使数据点的分布相对均匀。通过对散乱点云数据集进行数据预处理,并进行降维实验验证了方法的有效性。