改进的谱聚类算法及其应用研究

来源 :中北大学 | 被引量 : 0次 | 上传用户:asaaaas
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代,数据挖掘成为最活跃的领域之一。在这一领域中,能根据数据点之间相似度的差异,将待聚类的数据集划分成不同类的聚类分析占有着重要地位。谱聚类算法是以谱图划分为理论基础的聚类算法,借助其扎实的理论基础,便于人们理解的聚类原理,较易实现的聚类步骤,广泛的应用场景,备受研究者们的关注。本人在研究经典谱聚类算法及其相关理论后,对谱聚类算法做了进一步改进,主要工作如下:1)概述谱聚类算法所依托的谱图理论中的相关知识,重点分析谱聚类算法的研究现状,针对研究热点提出改进方向。2)提出一种基于自适应相似矩阵的谱聚类算法。为解决高斯核函数中尺度参数的波动对聚类结果产生影响这一问题,引入测地距离和密度两个概念,构建了一种无参自适应相似矩阵,用于待聚类数据集中数据点间相似性的表达。在5个人工和5个标准UCI数据集上都进行实验验证。相同条件下,对验证结果和传统的NJW算法、K-means算法比较,结果表明改进算法准确率最高,对复杂结构数据的聚类更有优越性。3)在对图像进行分割时,谱聚类算法需要考虑该图像的所有像素点,造成相似矩阵的计算量大,有时甚至会内存满溢无法继续运行。积分方程中Nystrom方法较好的解决了该问题,随机采集一定数量的样本点,寻找样本点间的相似性,同样在样本点与非样本点之间寻找相似性,然后利用这两种相似关系来近似表征所有像素点的相似性,在构建上述所需2种相似关系的相似矩阵时,距离度量采用余弦函数,对得到的低维向量子空间聚类时采用近邻传播聚类算法,克服了K-means算法对初始值的依赖性,最后在真实图像上验证算法的优越性。
其他文献
近些年来,多智能体系统广泛应用于无人机、蜂拥、传感器网络、环境监测、编队控制等众多工程领域中,多智能体系统的协同控制问题已成为复杂系统以及网络科学的重要研究对象。一般情况下,我们主要依据多智能体系统中领导者的数量将协同一致性控制问题分为无领导者共识、单领导共识和多领导共识这三种情况。对于多领导者控制问题,也称其为包容控制,它是通过执行与相邻智能体之间的一致性控制协议,使得所有智能体的状态渐近收敛于
放射影像科在医院中是对患者进行诊断和治疗不可或缺的医技部门,在规划设计上相比其他科室有一定的特殊性。本文以浙江大学医学院附属妇产科医院为例,总结了放射影像科建设中的