基于密度敏感的谱聚类算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:zero_alan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的数字化,急需能够处理大量数据的技术,数据挖掘的产生推动了信息化的发展。在数据挖掘中,使用聚类算法能够在没有样本等学习知识的情况下发现隐藏在大量数据中的知识。谱聚类算法作为聚类算法中的一种,将聚类算法中的数据划分问题转化成无向图的分割问题,算法重点关注数据点之间的相互关系,弱化了数据点自身的特征,解决了传统聚类算法中不能处理复杂簇,容易陷入局部最优解的问题。密度敏感谱聚类算法作为谱聚类算法的一种,针对谱聚类算法中如何构建描述数据样本相互关系度量的问题,定义了一个描述数据点之间的相似度方法:密度敏感的相似度,更有效的描述了数据点之间的相似关系,提高了算法的准确性。本文以密度敏感谱聚类算法的研究为基础,分析密度敏感谱聚类算法的优势和缺陷,并针对存在的缺陷问题进行了优化。本文的主要工作如下:1.研究了密度敏感谱聚类算法及算法流程,通过对算法的理论分析和仿真实验模拟,研究了密度敏感距离的优势以及算法中存在的问题:密度敏感距离的伸缩因子需要人工指定;密度敏感距离会因距离的变动,改变相对位置不变的数据点之间的相似关系;聚类数目需要人工指定。2.对于密度敏感谱聚类算法中伸缩因子以及密度敏感距离的问题,通过计算,研究了密度可调节线段长度导致数据点相对位置不变,相似关系发生变化的原因,通过使用局部信息来计算每个点的伸缩因子,提出了一种数据用局部信息的密度敏感谱聚类算法,并将该算法进行了理论验证和数据集上的验证,验证算法较密度敏感谱聚类算法的优势。3.研究了聚类数目在算法过程中的影响,分析了拉普拉斯矩阵中特征值和聚类数目的关系,研究了根据本征间隙的特性来确定聚类数目的方法,并在数据集中进行了相关的证明实验。
其他文献
碳纳米材料,如富勒烯、碳纳米管、石墨烯和碳纳米锥等,因具有诸多奇特的物理化学性能,如低密度、高强度、高导热率、高导电率和大的比表面积等,在各个工程领域中均有巨大的应
情感教育是通过在教育过程中尊重和培养学生的社会性情感品质,发展他们的自我情感调控能力,促使他们对学习、生活和周围的一切产生积极的情感体验,形成独立健全的个性与人格
图像拼接是数字图像处理与计算机视觉领域的研究热点,主要是将多幅相互间存在重叠区域的同一场景的图像进行拼接,从而得到一幅高质量的全景图。本文研究基于SIFT特征的全景图
随着国内外经济形势的不断转变,我国经济增长已经从高速增长转变为中高速增长,传统的经济增长理念难以实现持续稳定增长,在寻找新的经济增长动力过程中,向服务业经济尤其是生
在肿瘤的治疗过程中,大部分抗癌药物(如阿霉素、顺铂、喜树碱、卡培他滨、丝裂霉素等)由于缺乏控制释放和靶向特异性等常常分布于全身,而且由于使用剂量较大,病人往往会产生
随着机器自动化及智能化的迅速发展,身处核心的计算机视觉技术吸引了大量研究人员的注意。作为计算机视觉领域中的关键问题和核心技术之一,视频跟踪已成为图像处理领域专家的
从古到今,人类对草地资源的利用方式主要是放牧家畜以获得所需的生活物资。然而,近年来随着人类对草地资源开发利用的不断加重,无节制的超载放牧等一些不合理不科学的放牧行
从1995年至今,文化素质教育在我国已经走过二十多年,在高校对文化素质教育的不断实践与探索中,逐渐摆脱了过去的狭隘的专业技能教育模式,对文化素质教育的重视程度在不断加强。目前,高校文化素质教育虽取得了喜人的成绩,但仍有课程体系杂乱、评价存在随意性、观念滞后等问题的存在。鉴于此,本文通过以广西文化素质教育基地中的三所高校作为调查对象,对高校文化素质教育的现存问题进行探究,提出文化素质教育质量保障系统
基于图像处理、计算机视觉的智能视频监控技术主要涉及目标检测、目标跟踪、行为学习、场景理解等方面,其中运动目标检测的效果直接决定了后续处理能否顺利完成,是智能视频监
在科技迅速发展的移动时代,以源节点到目的节点之间不存在一条完整的通信路径,依靠节点相互协作完成消息投递的机会网络引起了众多学者的关注,并已经成功运用于野生动物追踪