基于随机矩阵变换和贪婪算法的快速PCA算法

来源 :辽宁师范大学 | 被引量 : 0次 | 上传用户:freeskykq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学的进步,信息技术得到了快速发展及广泛应用,如医学图像处理、计算生物学、全球气候模型等,高维数据应运而生。高维数据难以被现有的机器学习和数据挖掘算法进行有效地处理。降维算法是处理这些高维数据的一个非常重要的工具和方法。而流形学习作为一种高维数据降维的技术手段,在非线性降维方面取得了广泛的应用。其中主成分分析(PCA)是一种假设全局能够线性化表示而提出的流形学习算法。在数据规模越来越大的今天,数据处理速度越来越成为人们关注的重点。但是我们又不想在牺牲算法准确性的基础上降低时间复杂度,因为那样会使得降维或分类后的数据无法如实反映原有数据的信息。本文主要主要工作如下:1.对降维算法做了总体的概述,重点介绍了两种算法—ISOMAP和LLE,并且指出了ISOMAP在求近邻点时将欧氏距离改为测地距离以后,算法所耗费的时间大量增加的缺点;简要比较了在不同近邻点数的情况下LLE降维效果的不同,并且对各向异性算法做了简单的介绍。2.对主成分分析(PCA)算法进行了深入的研究与改进,对PCA的特点进行了详细地分析,在数据集规模比较大尤其是行数和列数都在三千以上的情况下,我们指出了PCA算法中最耗时的步骤,展示了三种随机矩阵与贪婪算法在PCA降维过程中减少矩阵分解时间的重要作用,提出了在精确度要求不大的情况下(偏差小于5%),在偏差可估的情况下进一步加快算法的方法。并且我们用实验对比了两种降维模式和标准PCA的计算时间和用特征向量衡量的低维嵌入偏差。
其他文献
近几年来,有关“网格”的话题越来越热,并且有关网格的研究也越来越多。可以说传统的互联网实现了计算机硬件的连通,Web实现了网页的连通,而网格则试图实现互联网上所有资源
本文在软交换思想的基础上,深入研究了多个著名IP PBX的系统结构,并参与了上海交通大学金桥网络中心实验室的嵌入式IP PBX系统的实践项目。本文研究的对象是中小型IP PBX系统
作者运用UML建模方法,分析了研究生部综合管理信息系统的业务流程以及应用需求,分析、设计了研究生学位业务系统、门户网站系统、内部管理系统(用户管理)以及系统运行支撑平
过程监测与故障诊断是工业过程工程中的一项重要任务,是保证生产过程安全运行、提高生产效率的重要环节。多元统计过程控制方法与分布式对象技术相结合运用在状态监测领域可
网格计算是目前学术界和企业界都热切关注的,一个具有重要创新思想和巨大发展潜力的新兴网络计算技术。网格安全作为网格计算的基础其重要性不言而喻。而安全认证是安全服务
Web Service是一种新的分布式计算模型,具有简单、跨平台,松散藕合等特点,能够方便地实现异构平台上的应用集成。近年来,Web Service在电子商务领域,尤其是在B2B的电子商务应
有效的利用网络资源,对日趋复杂的电路交换进行调度和管理的能力,并保证网络的可靠性、抗毁性等,是每个运营商都必须面临的重要问题。数字交叉连接(DXC)解决方案的强大技术将
随着计算机网络的普及和通信技术的飞速发展,信息资源极大充足,便利了人们的日常生活,同时信息的保密性和安全性也受到了极大的挑战,攻击工具的增加、使用的简便性更为计算机入侵
本文首先总结了电子支付的各种实现方式,包括电子信用卡、电子支票、电子现金和微支付,分析了各种实现方式的优缺点。对电子现金的可分性进行了研究和探讨。 文中对微支付进行
本文首先介绍了仿真技术和基于案例系统的研究及应用现状。在降落伞虚拟设计及仿真系统的开发中,我们首次将专家系统与仿真技术结合起来,提出了一种基于专家系统的仿真机制,