流形学习算法ISOMAP的改进与实现

被引量 : 0次 | 上传用户:suilong12341106
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
维数简约是处理这些高维数据的一个有效手段,可以有效地避免“维数灾难”,发现高维数据中的内在规律性。其目的是:在不改变原始高维数据的本质结构的前提下,尽量减少或去除冗余信息,减少原始数据的维数,从而达到维数简约的目的。通过现有的线性简约方法分析,能够得出线性高维数据的真实几何结构。由于现实世界中的数据大多是非线性的,我们需要可以有效处理非线性高维数据的维数简约方法,然而传统的线性简约方法的线性本质决定,此类方法只能用来发现高维数据中的全局线性结构,不能有效的找出高维数据中的非线性结构。流形学习方法在此背景下应运而生,用来解决分析非线性高维数据时存在的难题,能够有效地寻找非线性高维数据内部的几何结构。等距特征映射算法是一种典型的全局优化流形学习算法,它的嵌入结果可以反映出高维数据样本之间的流形距离,能够得到比较理想的嵌入结果。该算法的一个重要问题是所需计算时间多。针对这个问题,本文提出通过模糊C-均值聚类方法选取具有代表性的界标点,来改进等距特征映射算法。先利用模糊聚类算法将高维数据样本集进行简单的分类,求出各类的聚类中心并作为等距映射算法的界标样本点,构造距离矩阵,最后通过LMDS方法求解最后的嵌入结果。另外,ISOMAP算法是否能准确地得到高维数据集合的低维嵌入结果,主要依赖于邻域点个数的选取,如何选取合适的邻域点,仍是一个开放性的问题。结合模糊聚类理论及图的相关理论,本文提出了试探性邻域值估计算法TNVE,以确定ISOMAP算法的参数—邻域值。
其他文献
目的:探讨高校学生工作下社区的新方法与新思路。方法:在学生社区试点,有针对性地开展前期调查、中期访问、结果分析。结果:"时间银行"的参与情况符合不同性别与年级学生的心
本文旨在研究日常交流中的隐含语体,试图解释隐含语体差异性的原因及其表现。根据Sperber和Wilson提出的关联理论,隐含产生于追求关联的过程中,它取决于说话人对听话人所知语境
我国的'一带一路'倡议为我国基建企业进一步'走出去'提供了前所未有的契机。国内外基建企业发展经验显示,加强企业在海外市场的宣传,不仅有助于基建企业&#39
开发和应用刑侦行动办案技术是科技强警的现实要求。为此,文章就刑侦行动办案技术的概念、适用范围,以及运用该项技术的保障机制等问题,进行了一定的阐述,提出了相关的观点。
<正>近两年来,广西在全区范围大力推进农村生活垃圾统筹治理,共投入资金187亿元,新增城镇垃圾处理场(厂)7座、垃圾无害化处理场增加到82座;新增乡镇垃圾中转站510座,配备垃圾
Zhang Sizhong’s Foreign Language Teaching Approach Can be generalized as follows: "Suitable Centralization, Repeated Circulation. Reading the Original, and Tea
商号即店铺的牌号,上面有店铺的名号、行业分类、商品名称或服务范围等相关内容,起着示意及区别的作用。商号的功能是招徕顾客,除了力求言简意赅、使人一目了然外,更要求清新、易
巢湖地处地质富磷区,周边岩石自然风化或人工开发过程所造成的磷素迁移对湖泊富营养化的贡献不容忽视。本文以国家水体污染控制与治理科技专项为依托,研究了巢湖北岸东部流域