论文部分内容阅读
针对许多经典的图聚类算法存在输入参数难以确定、时间复杂度过高、聚类精度较低等缺点,提出了一种无须输入参数的基于核心顶点的图聚类算法(NGCC)。该算法将相似的顶点分配到同一个簇后,再利用PageRank算法发现核心顶点以形成初始簇;然后将剩余的未标记顶点进行分配,形成最终簇结构。实验结果证明,NGCC算法在无须任何参数的条件下,在不同规模数据集上的聚类质量与对比的经典图聚类算法相当或更优,而且适用范围更广。