论文部分内容阅读
针对现有聚类算法K-均值存在事先指定聚类类数及仿射传播存在计算复杂度偏高的缺陷,提出了一种新型的聚类算法IncreaseK-Means,并将其应用到Blog内容的相似度聚类分析中,较好地满足了社区发现和话题跟踪的需求.仿真结果表明:在Blog文本聚类分析中,IncreaseK-Means在时间上与K-Means相近,在精度上与仿射传播接近,适用于大规模网络文本的分析处理.