基于谱图理论的非线性流形学习算法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:tenhuanggou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的高速发展,人们获取数据的渠道越来越多,数据维数也急剧膨胀,如何对这些海量数据进行维数约简,从中提取对人们有用的信息,成为模式识别及机器学习等领域的关注重点。本文重点研究了维数约简方法中基于谱图理论的非线性流形学习算法,详细分析了几种现有的经典算法,并对其不足之处进行了改进,进而提出了两种高效的特征提取方法。本文的主要贡献及创新如下:1)详细介绍了流形学习算法的研究背景及国内外研究现状,对现有的经典算法进行总结,分析了其优缺点。2)在局部邻域嵌入(Local Neighborhood Embedding,LNE)算法中,传统邻域样本的选取方法会导致伪样本的产生。另外,LNE算法是一种非线性流形学习方法,存在样本外问题,同时它还忽略了样本的类别信息,所提取的特征信息存在冗余。针对这些问题,提出了不相关判别局部邻域嵌入(Uncorrelated Discriminant LocalNeighborhood Embedding,UDLNE)算法,该算法首先将LNE算法线性化,然后在目标函数中融合了样本的类别信息,有效地分离了同类样本和异类样本,并且通过添加不相关限制,极大减少了特征信息的冗余。该方法是一种线性的监督算法,能够有效地提取样本特征,具有较高的识别率。3)正切空间判别分析(Tangent Space Discriminant Analysis,TSDA)算法是一种监督的流形学习算法,该算法在保持样本的类内局部几何结构的同时最大化类间差异,极大地增强了算法的判别性。然而,TSDA算法只是一种线性方法,不能很好地发掘出数据的非线性特征,同时由于小样本问题的存在和距离度量结构的破坏,进一步削弱了算法的性能。针对这些问题,提出了核正交判别局部正切空间对齐(KernelOrthogonal Discriminant Local Tangent Space Alignment,KODLTSA)算法。该方法能够很好地发掘出数据集潜在的非线性特征,有效地避免了小样本问题,并且通过添加正交限制,保持了数据间的距离度量结构,表现出了较好的分类效果。
其他文献
无线传感器网络是当今工业界和学术界的研究重点,在许多领域有着非常广阔的应用前景。IEEE802.15.4是IEEE专门针对低速无线个人区域网络制定的标准,该标准低能量消耗、低速率传
随着各种高新技术的广泛应用,战场探测手段日趋多样化,设计出高质量的迷彩成为愈来愈迫切的需求。而数码迷彩因其边缘模糊、破碎,具有较强的立体感和层次感,更易于模拟自然场景,伪
网络和通信技术的迅速发展,导致了网络规模扩大、复杂性增强。互联网用户和新兴网络服务的增加,也对网络管理提出了更高的要求。如何对网络进行有效的监控和管理是人们迫切需要
随着物联网(IOT)技术的广泛应用,它给传统的应用管理模式带来了重大改进。作为物联网信息采集端的无线传感器网络(WSN),对于其关键技术的研究又重新引起人们的重视。目前,物联网
随着虚拟现实技术的发展,操作自由、交互智能友好成为下一代人机交互技术发展的趋势,它以人为本,把计算机作为多通道、多模式、多媒介的感知识别器,通过识别人的语音和动作包括人
本体是一种有效地表现概念的层次结构和概念语义的模型,它被广泛的应用到了计算机科学的许多领域。在对语义网技术的研究过程中,本体更是我们研究的重点。但是伴随着语义网的快
随着信息时代的发展,使得人们越来越依赖手机和互联网获取信息,而在这些信息中有很大的一部分都是以短文本的形式存放,因此对这些海量短文本的挖掘能够很好的了解用户的兴趣信息
当今社会对信息安全的要求和依赖程度越来越高,安全的密码系统在其中扮演着核心的角色,而密码协议就是非常重要的一环。密钥协商协议是密码协议中最为重要,应用最为广泛的一种。
随着无线通信技术步入3G/4G时代,人们对广覆盖、高带宽的无线通信网络的需求越来越迫切,特别是当前越来越多的数据服务发生在室内环境下,室内无线网络覆盖变得非常重要。但是
随着无线AdHoc网络的广泛应用和复杂多媒体应用的不断流行,无线AdHoc网络的业务量陡然剧增。如何把有限的无线资源,以合理的方式分配给不同的用户或应用,以满足他们各自对无线资