论文部分内容阅读
随着信息采集方便程度的迅速提高,在模式识别及计算机视觉领域涉及到大量分布于流形上的非欧数据集,基于流形空间而非欧式空间进行分析,可获得数据集的本质非线性规律,对于设计高效的数据存储和可视化系统、以及模式识别系统有着重要意义,是当今国际模式识别与计算机学习领域的研究热点课题之一。当非欧数据集的具体分布结构未知时,需对数据集所在流形结构进行探测估计,以获得数据集的几何分布结构,从而为基于数据的分类、决策系统提供指导信息,然而现有方法未能很好的实现从观测空间直接对流形结构进行探测,致使流形结构的探测问题一直是模式识别、数据挖掘等相关领域的关键问题之一。相反,尽管一些计算机视觉特征数据所在的特殊解析流形结构已知,但基于其解析结构设计更为精准的识别算法仍然是一个应用难点。针对上述难点与关键问题,本文在分析与总结国内外相关研究的基础上展开了深入的研究,分别提出了以下四种解决算法:(1)针对非线性数据集上的流形线性结构探测问题,提出了基于Grassmann测地相似度和蚁群聚类模型的非线性流形线性结构探测算法,解决了在流形学习角度下无法从观测空间直接进行流形结构探测的问题。在合成数据集与实际数据集上的实验表明,与同类传统算法相比,本文算法具有挖掘非线性流形上线性结构的新特性,并且通过改变聚类数,可以捕获同类传统算法无法发现的数据集局部线性变化信息。(2)针对数据集一维线性流形结构的快速挖掘问题,提出了基于密度权EM与分裂合并策略的算法,解决了现有一维线性结构探测方法对参数及噪声敏感的问题。实验结果表明,与经典方法相比,本文算法在挖掘数设置与数据集中的本质线性结构数不相符时可以获得更佳的挖掘效果,并且能够正确挖掘出噪声环境下的数据集线性结构,同时具有良好的实时性品质。(3)针对2D轮廓的仿射不变识别问题,提出了基于矩阵Langevin分布以及多部件多尺度轮廓Grassman表征模型的内蕴boost仿射不变轮廓识别算法,解决了无需借助黎曼映射而直接在Grassmann流形上进行分类的问题。通过理论分析以及实验表明,提出的算法在较低轮廓采样点下仍然可以获得较高的识别率,效果好于现有外蕴算法、传统仿射不变轮廓识别等经典算法,同时能够较好的处理现有算法表现较差的轮廓片段部分不纯净的问题。(4)针对自然图片及监控视野中人体目标的旋转不变检测问题,提出了一种基于梯度方向直方图的Polar-HOG协方差特征,并利用对称正定流形设计了旋转不变人体检测算法,解决了传统HOG特征及协方差阵特征不具备旋转不变性的问题。与典型方法相比,在处理目标旋转上,提出的算法具有更佳的分类及检测性能,能够以较低的错识及虚检率获得较高的识别与检出率。以上研究成果为非欧数据集的分布结构探测问题提供了新的解决方法,丰富了特殊解析流形在计算机视觉方面的应用研究,相关实验表明了提出方法的有效性与先进性,与典型方法相比具有很大提高,为进一步拓展非欧模式识别及计算机视觉的新基础理论和算法支持奠定了坚实的基础。