高维数据分析中的降维方法研究

来源 :中国人民解放军国防科学技术大学 | 被引量 : 0次 | 上传用户:kxianwen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究高维数据处理中的降维问题和降维方法。第一章首先提出了降维的模型和定义,讨论了相关的问题;第三节讨论“维数祸根”现象和高维空间的稀疏性,通过实例分析其对高维空间的数据分布特性具体影响;第四节讨论了本征维数及其估计的基本问题。 第二章是降维方法的回顾与分析,通过对比和综合若干常用降维方法,依据降维映射的形式提出一种分类方法,而后以降维问题的模型和分类为指导,讨论了几种常用的降维方法,特别是重点分析了经典线性降维方法——主成分分析方法,通过实例说明它不适用于处理非线性问题。 第三章围绕一种新兴的统计降维方法——投影寻踪展开讨论,概述投影寻踪的一般理论,定义了投影指标和投影寻踪的概念,证明了传统的主成分分析方法是投影寻踪的一个特例,证明了正态性与Friedman指标为0的等价性;第三节针对高光谱图像处理问题,从实例和理论两个方面,论证了以信息散度为指标的投影寻踪方法在提取信息的能力上优于以方差大小作为衡量信息量多少标准的主成分分析方法。 第四章是本文的重点内容,研究一种全新的非线性降维方法——局部线性嵌入方法,对它的思想和算法进行了详细的分析,给出算法两个相关定理的证明;第三节对比主成分分析,通过实例说明局部线性嵌入方法的非线性降维特征;第四节在此基础上提出了旨在结合两者优势的组合降维方法;第五节提出了局部线性嵌入方法中存在的若干关键性问题,包括流形的局部性、邻点的选择、本征维数的估计和降维映射的表示,第六节基于局部线性近似的思想提出了一种本征维数的估计方法,设计了实用算法,结合实例对算法中参数的选取进行了讨论;最后一节提出了一种基于局部线性重构的图形分类和识别方法,将其应用于手写体数字的图像分类识别实验,实验得到的分类准确率达96.67%。 本文的主要创新点在于:提出了降维映射和嵌入映射的概念;给出了投影指标的严格定义,证明了两个相关定理;提出了一种用于估计本征维数的方法并设计了实用算法;提出了一种基于局部线性重构思想的分类和识别方法。
其他文献
环氧树脂(EP)是具有优良机械、绝缘和粘结性能的热固性树脂材料,应用极其广泛,但由于其极易燃烧并释放出大量热和有毒烟气,威胁人们的生命和财产安全。9,10-二氢-9-氧-10-磷杂菲-10-氧化物(DOPO)是一种新型高效环保反应型阻燃剂,比传统有机磷酸酯阻燃剂具有更高的热稳定性和化学稳定性,从而成为阻燃环氧树脂研究领域最具应用前景的一种阻燃剂。为改善DOPO较低温度分解而影响其阻燃效果的缺陷,开
在无线电频谱监测中,随着数据采集能力和采样频率的不断提高,对算法的时效性提出了更高要求。对于宽带信号测向系统,提出基于稀疏快速傅里叶变换的互谱法相位测量算法,该算法
越是关键时刻,越要坚定信心和决心。江苏省扬州市民政局在疫情防控吃劲时期,要坚持统一思想,坚决按照上级决策部署,严格落实好各项工作任务,迅速启动疫情防控的各项工作。要求全体
报纸
利用单个矢量水听器可以测出目标声源的方位,提出了一种利用单矢量水听器基于互谱测向的多目标分辨方法。利用互谱测向方法计算出测量过程中各个目标的方位变化轨迹,画出方位
在混凝土中掺加粉煤灰(Fly ash)替代部分水泥可以显著降低W/B,并同时获得良好的工作性,而且粉煤灰混凝土的后期强度发展良好。研究分析了普通水泥、普通粉煤灰和磨细再生粉煤灰
现如今电子信息技术与互联网络技术的飞速发展,为社会各行业领域内经济建设提供了更为广阔的发展空间,特别是数字动漫游戏产业发展表现出前所未有的新活力,伴随着信息网络技
在相同观测条件下,对比分析洛阳地震台观测井FD-105K型与SD-3B型模拟水氡仪同期观测资料,结果显示,实际观测变化趋势一致,数据动态变化类似。一阶差分分析表明,FD-105K仪观测
化学元素的周期性与原子的电子层结构密切相关。因此凡是和类似的电子构型有关的一切性质都应呈现出周期性的变化。但是这种变化并不是简单的重复,而是依一定方向作有规律性
混凝土配合比设计与混凝土的工程性能和单价、成本密切相关,通过提升拌和楼的生产管理水平、降低混凝土配制强度的标准差,进行混凝土配合比的优化设计,进一步将混凝土的工程
为了提高电气体发电循环的热效率,在有回热的布雷顿循环基础上,对喷管中膨胀的气体进行加热,使循环过程尽量接近Ericsson循环.用CFD数值模拟的方法研究了有热添加的喷管流动,