基于流形学习的数据降维技术研究

被引量 : 5次 | 上传用户:lideqiang163com
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然界中的数据大都以高维非结构化的形式存在,信息化技术的高速发展使得获取这些数据成为了可能。高维数据不仅难以被人们直观理解,也难以被现有机器学习和数据挖掘算法有效处理。降维操作已经成为处理这些数据的一个重要手段,经过几十年的发展,降维技术已经取得了长足的进步,出现了如PCA、LDA等一系列经典方法,但在当下的线性与非线性降维领域仍然存在许多具有挑战性的问题。21世纪的头十年里,以ISOMAP、LLE为代表的流形降维方法突发猛进,成为了当下最为热门方向之一。论文从广义流形学习定义出发,围绕线性流形与非线性流形降维算法展开,从全局线性流形降维、全局非线性流形降维、局部非线性流形降维对流形学习算法进行了一些研究,主要工作有:针对线性判别分析在实际识别任务中计算消耗大、内存需求多,易出现“小样本问题”的缺点,将传统线性判别分析的方法放到图嵌入的框架下进行分析,结合正则化技术,设计了一种图嵌入正则化的线性判别分析方法。首先构造了非监督最优类可分准则,通过图嵌入理论得出一种求解该判别准则下最优投影向量的方法,最后将求解传统LDA中投影向量的复杂特征值分解过程转化成为一个简单的特征值分解和一个正则化拟合问题。针对局部线性嵌入算法对近邻点个数的选择依赖性较强,不适应处理稀疏数据源的缺点,提出了一种基于几何距离摄动的局部线性嵌入算法。从几何直观的角度,提出了一种根据几何摄动值来判定流形结构上的两个点是否处于同一线性平面的方法,根据这一方法,提出了一种基于几何摄动的分块算法,将原始流形数据划分为一组最大线性分块的组合;在进行局部嵌入的过程中通过线性块内的点来确定局部线性嵌入算法中近邻点的选择范围,从而保证局部线性嵌入算法局部线性特性这一假设条件得到满足。
其他文献
<正>影响新世纪学前教育的两件大事本世纪初,德国著名学前教育家费纳克斯教授曾指出,有两件大事预示着在国际范围内学前教育进入了一个新纪元,其一是欧洲早期教育研究学会(EE
目的:观察急性心肌梗死患者血清甲状腺激素和外周血白细胞计数的变化,探讨它们与急性心肌梗死心衰严重程度的关系。方法:70例急性心肌梗死患者按Killip分级及EF%分为心衰组32
<正>实现中国梦必须凝聚中国力量。这就是中国各族人民大团结的力量。历史告诉我们:当人民群众处在一盘散沙时,是没有力量的,只能任人宰割与奴役;只有人民组织起来、团结起来
随着江苏省农业的快速发展,农业面源污染问题日趋严重。如任其肆意发展,农业面源污染将不断侵蚀江苏省的生态环境,影响省内居民的日常生产与生活,甚至危及到子孙后代的幸福,
<正>本刊讯8月25日,"庆祝中华人民共和国成立70周年暨统一战线助力脱贫攻坚·统战宣传基层行采访活动"中央和省市新闻媒体一行走进陕西省汉中市同利源茧丝绸有限公司蚕桑示范
随着大数据时代的迅猛发展,人们获取资源信息的途径手段层出不穷,这对于传统的基层数据统计工作而言无疑是一种巨大的机遇和挑战,基层统计部门应当顺应时势,将传统的数据统计
此文结合本人7年的教学经历,从教学准备的有效性、教学实施的有效性,以及教学反思的有效性几个方面,就如何打造高中英语高效课堂进行初步探讨,以求提高自身素质,提高课堂效率,从而
外部技术获取是我国装配型企业技术发展的有效方式。但是,持续的外部技术获取并没有使我国企业建立起支撑产业技术持续发展的创新体系。如何更好的利用外部技术获取实现企业
辽代契丹贵族女性有着较高的社会地位,在整个封建妇女史上是相对少见的。这主要是契丹民族传统习俗和当时政权统治的需要,同时也是契丹贵族女性自身适应时代需要不断努力的结
文章概述了海绵城市建设的三大关键策略:消纳、减速与适应。并分别通过哈尔滨群力湿地公园、六盘水明湖湿地及金华燕尾洲的实验工程检验了它们的有效性。这三个关键技术可以