K近邻优化的密度峰值快速搜索聚类算法

来源 :中国科学:信息科学 | 被引量 : 0次 | 上传用户:sheep0211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对2014年6月发表在Science的密度峰值点快速搜索聚类算法的样本局部密度定义和样本分配策略的缺陷,提出一种基于K近邻的快速密度峰值搜索并高效分配样本的聚类算法.算法利用样本点的K近邻信息定义样本局部密度,搜索和发现样本的密度峰值,以峰值点样本作为初始类簇中心;提出两种基于K近邻的样本分配策略,依次分配样本到相应类簇中心,得到数据集样本的分布模式.理论分析和在经典人工数据集、UCI数据集及Olivetti人脸数据集的对比实验表明:提出的基于K近邻的密度峰值搜索聚类算法能快速发现任意形状、任意维度和任意规模数据集的类簇中心,并合理分配样本到相应类簇,揭示数据集样本的分布模式,对噪声数据具有非常好的鲁棒性,聚类结果优于2014年6月发表在Science的密度峰值点快速搜索聚类算法,以及经典聚类算法AP,DBSCAN和K-means.本文算法是一种非常有效的聚类算法,可用于发现任意数据集的隐藏模式与规律.
其他文献
<正> 英国伟大作家狄更斯的《双城记》是世界文学名著中的一颗玫丽明珠。在其著作中,狄更斯采用了不同的修辞手法来达到现实主义的刻画和描写的目的。本文所说的平行结构系指
为了揭示安徽省玉米种植密度现状,提出适合安徽不同种植习惯的密度调控对策,为安徽省玉米单产的提高提供科学依据。笔者连续2年对安徽省玉米产区7市24县区进行密度取样调查,分析
教学中进行思想品德教育所采用的方法、手段是多种多样的,将这些方法合理地进行分类,对提高思想品德教育质量具有重要作用。
鲁道夫·阿恩海姆是西方现代美学史上著名的格式塔心理学美学家。在他七十多年的学术生涯中,他为美学、艺术心理学、艺术教育、以及新媒体领域都做出了突出的贡献。二十世纪
<正>《荷兰风车》是鄂教版第八册第五单元的一篇说明文。课文通过对荷兰风车在荷兰人生活中重要作用的叙述,表达出对风车的喜爱之情。介绍荷兰风车时,课文把风车当人写,读来
目的:评价彩色多普勒超声在检测微创经皮肾镜取石术(MPCNL)并发症中的临床应用。方法:应用彩色多普勒血流显像观察30例MPCNL手术患者,于术后3 d、7 d、1个月观察患肾有否肾积
针对发射台发射机房现有运行情况,为了实现机房的信息化建设,实现机房内各应用系统间网络互通、资源共享,利用现有计算机软件技术和网络接口技术,开发设计了发射机房运行监控
随着互联网+时代的到来,以微博、微信为代表的新兴社会性媒体,信息的传播呈现明显的"碎片化"特性,对大学生的传统思想政治教育价值观念的全面性带来冲击,更对大学生思想政治
消灭剥削,消灭私有制,是共产主义的根本目标,也是马克思恩格斯政治思想的重要内容。但在我国过去,由于教条主义地理解马克思主义关于消灭私有制的理论,将生产资料所有制性质的一大
[目的]了解临床实习护生职业生涯规划认知现状以及对职业生涯规划教育的需求,分析影响临床实习护生职业生涯规划认识的因素。[方法]在文献分析、访谈的基础上自行设计护生职