【摘 要】
:
当今社会,许多实际问题涉及到高维数据的集合,比如图像、视频、文本和web文档以及DNA微阵列等。传统的聚类方法一般采用欧氏距离作为数据之间的相似性度量,但是在高维空间中
论文部分内容阅读
当今社会,许多实际问题涉及到高维数据的集合,比如图像、视频、文本和web文档以及DNA微阵列等。传统的聚类方法一般采用欧氏距离作为数据之间的相似性度量,但是在高维空间中难以用欧氏距离来度量相似性。本文研究了基于稀疏和低秩的子空间聚类算法,它们对高维数据的聚类十分有效。首先,引入了子空间聚类算法相关的理论知识,包括图论、矩阵范数和谱聚类。主要介绍了连通图、图的邻接矩阵以及图的拉普拉斯矩阵,详细阐述了子空间聚类算法和谱聚类算法的流程。其次,综述并比较了八种流行的子空间聚类算法。引入了稀疏子空间聚类、低秩表示、低秩子空间聚类和最小二乘回归聚类等算法,给出了每种算法的具体步骤,分析并比较了每个子空间聚类算法的模型和约束条件。然后,将主流的子空间聚类算法分别应用在高维数据聚类、合成数据聚类、人脸聚类和运动分割中。实验结果表明:在高维数据聚类过程中,归一化处理对子空间聚类结果有显著提高;对于低秩合成数据,在没有噪声的情况下子空间表示矩阵具有明显的块对角结构,而对称的低秩表示算法(LRRSC)对噪声更具稳健性;在人脸聚类中,LRRSC算法仍对稀疏大噪声具有稳健性;在运动分割中,最小二乘回归算法(LSR1)取得了最好的聚类结果。最后,本文分析了现有算法的不足,并指出进一步研究的方向。
其他文献
OPC(OLE for Process Control)作为过程控制的对象链接与嵌入(OLE)技术,采用Server/Client数据访问模式,提供了高效的信息集成和交互功能的接口规范,在过程控制和自动化领域
摘 要:本文论述了4D产品的产生及用途,着重给出了当今测绘技术中4D产品的生产现状以及对4D产品的质量控制。 Abstract: This article introduced the orgin and application of 4D production, depicted in detail the current production of 4D by survey technolo
本文以数学机械化思想和导师张鸿庆教授提出的AC=BD理论为指导,借助于符号计算软件Maple,研究了符号积分和微分方程求解中的一些问题:精确波解、有理积分、微分扩张、初等积分、
两正态与多正态分布的参数估计问题是统计中的经典问题。人们很早也就开始了对它的研究。两正态与多正态分布数据在很多领域有着广泛的应用。例如,生物学、物理学、医学、经济
摘要: PCM 是一种通过遥测地下管道中电流,既可进行管道定位又可用于管道防腐层状况检测的设备。阐述了PCM 系统组成、工作原理及用途。并通过庆铁线输油管道防腐层状况的普查情况,对 PCM在地下管线探测中的应用及检测过程的应用条件进行了分析。 關键词:PCM 管道定位,长距离,管道防腐层状况 Abstract: PCM is a through the telemetry undergroun