基于局部邻域优化的降维算法研究

来源 :辽宁师范大学 | 被引量 : 0次 | 上传用户:mxyyd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展与应用,高维数据随之产生,被成功应用到“数字化”世界中,如高光谱图像分析、地理信息系统、计算生物基因学等。高维数据维数高、信息量繁杂的问题不断挑战着计算机的软、硬件能力。传统的聚类、分类等算法已不能满足对高维数据处理的需要。这时,流形学习成为解决数据维数过高的有效手段。流形学习的目的是把高维数据嵌入到低维流形中,得到低维空间表达效果。它是机器学习中的重要方法,成为高维数据降维的先进技术手段。在很多计算机应用领域中,流形学习有广泛的应用,成为近年来的研究重点、热点。这些方法有:等距映射、局部切空间排列和局部线性嵌入等。非线性降维方法几乎都是假设任何局部可近似线性化而提出的。但是在很多时候,高维数据样本点分布复杂,局部子空间很难满足局部可近似线性化的假设,导致最后的降维效果不理想。在这种情况下,局部邻域子空间的优化就成为了研究流形学习的重要方面。本文主要对局部线性嵌入(LLE)算法和局部切空间排列(LTSA)算法进行了研究,对流形学习中的邻域优化问题提出相应的解决方法:(1)研究经典局部线性嵌入(LLE)算法,对算法中全局信息和局部信息的提取机制进行分析后,在LLE的基础上提出了一种改进方法。经过实验证明,新方法有很好的稳定性和有效性。(2)研究经典局部切空间排列(LTSA)算法,发现存在局部邻域信息量不足、短路和噪音干扰等问题,严重影响降维效果,很难广泛应用于真实数据的处理中。对以上问题分析,发现经典降维算法都是采用全局固定的邻域大小。我们提出了一种基于压缩感知的邻域优化算法,运用压缩感知技术对高维空间目标点近邻进行压缩采样,构建“收—放”模型,自适应得到最优子空间,同时优化邻域组成元素,使得数据的整体降维效果更加稳定。
其他文献
基于Web的博士生教务管理系统是西安理工大学研究生综合管理系统的一部分,其目标是依托校园网和因特网,实现博士生教务管理工作的信息化。 作者根据Web信息系统体系结构模型
“IPv6多播技术研究及其在校园网中的实现”论文从该校IPv6校园网建设的实际情况出发,对IPv6的一些基础理论和应用展开了相关的研究并实现。 论文首先从IPv6协议的基本概念
在校园网络的管理中网络设备的管理是要首先解决的一个问题,因为网络设备需要管理的信息复杂、专业性强,直接决定着校园网的运行模式和使用情况,有必要建立一套适合各级网络
智能信息处理是当前信息科学研究中的一个热点问题。随着信息时代的到来,信息量不断增长,信息模式越来越复杂,因此对信息分析工具的要求也越来越高。针对以上这些问题,波兰华沙理
医疗诊断领域是信息处理技术一个前景十分广阔的应用领域。从20世纪70年代开始,国内外投入巨大的力量对医疗诊断专家系统进行研究与开发。但由于大多数研究只是注重于总结某
基于构件的软件复用研究的重点包括如何提取可复用的构件、如何对构件进行分类管理以及如何提高构件的检索效率等方面。本文以水利领域应用为背景,结合领域工程,分析基于现有软
随着网络技术和网络应用的发展,网络安全问题显得越来越重要。 分布式拒绝服务攻击(DDoS,DistributedDenialofService)是近年来对Internet具有巨大影响的恶意攻击方式,给互联
上海市计划在十一五建成居于国内同行业领先水平的水闸泵站综合调水调度系统,通过基于广域网的实时监测系统,完成对水闸、泵站调水运行数据、图像等的监测,并通过与水情、气象系
USB模拟器是全系统模拟器的重要组成部分,全系统模拟器通过软件对嵌入式硬件平台进行功能模拟,其主要用于手持设备及数码产品的前期软件设计。全系统模拟器包括CPU模拟器和外设
随着Internet上实时音/视频业务的发展,一些非TCP协议(UDP)被广泛使用。这些非TCP协议本身并没有拥塞控制机制,在发生拥塞时,会抢走TCP流的带宽,影响到TCP流正常应用,情况严重时,甚