论文部分内容阅读
K-Means算法是一种常用的聚类算法。通过分析传统K-Means聚类算法可知,该算法随机选取聚类中心并需要手动设定聚类个数,因此容易出现局部最优、稳定性差,适用范围窄的问题。为了改善聚类结果,对K-Means算法进行了改进,根据文本距离确定初始聚类中心,并在初始聚类完成后,对聚类进行合并,形成最终的聚类结果。实验结果表明,改进后的K-Means算法提高了聚类的查准率和查全率。