一种改进节点凝聚度的密度峰值聚类算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:suibiannicheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对密度峰值聚类算法(Density Peak Clustering,DPC)在密度分布不均匀及同一个簇有多个高密度点的数据集中难以准确选取聚类中心的情况,提出一种改进节点凝聚度的密度峰值聚类算法.先将数据转化为一个加权的完全图.其次,引入改进后的节点凝聚度的思想构建节点重要度的评价函数,并计算网络中每个节点的局部重要度,聚类中心为局部重要度最高的节点并且与重要度大于该聚类中心重要度的点具有较大距离.然后,对节点重要度进行排序,比较选取节点重要度与距离乘积值异常大的点作为类簇中心.最后,利用所提出的算法和其他密度峰值聚类算法比较,在人工数据集和真实数据集上的实验仿真表明,该算法能够找到具有更高精度的聚类中心,从而可以实现更高的性能.
其他文献
对MapReduce和Spark两种框架下的大数据极限学习机进行了比较研究.具体地,从程序运行时间、任务的同步次数、分类器的泛化性能和需要读写的文件数目4个方面进行了比较.得出了
常见词嵌入学习可以理解为是在分解词的点互信息值矩阵,主题一致性评价方法也使用了词的点互信息,二者存在紧密的联系,但是现今还缺少深入分析主题一致性评价标准和词嵌入之
概率主题模型与词向量模型的结合已经成为主题分类研究的一大热点,本文基于该思想提出了一种适用于网页主题分类的Skip-PTM模型.Skip-PTM模型吸取了LDA主题模型的优势,扩展了
针对矩阵分解推荐算法存在的数据稀疏和不能反映用户兴趣变化的问题,提出一种融合用户点评数据、用户-物品评分数据、物品异构信息和遗忘曲线的改进型矩阵分解推荐算法.首先,
为明确脂肪含量在高脂肪高产大豆品种东生79系谱中的传递规律,本研究分析东生79选育过程及系谱,追溯其祖先亲本对东生79细胞质及细胞核基因的贡献值.结果 表明:东生79的细胞
针对中文短文本的特征提取中存在特征稀疏的局限性,本文提出了一种基于多特征融合的短文本分类模型(Multi-fea-ture fusion model,MFFM).首先,通过字词向量结合的方式构建新
为了探究大豆MADS-box编码基因在生物和非生物胁迫中的调控作用,以SMV抗感大豆品种为试验材料,从大豆中克隆GmMADS基因Glyma.02g121500,进行生物信息学分析和表达特点分析,同
用户对服务的评分可被视为用户对服务的分类,而服务信誉则是在用户对服务分类基础上进行聚类的结果.在聚类过程中不考虑在线服务信誉度量结果与所有用户分类之间的一致性关系