论文部分内容阅读
文本的聚类是一种有效的文本管理方法,已经成为对文本信息进行有效的组织、集成、摘要和检索的重要方法,是文本信息处理领域的研究热点。K-medoids 聚类算法是一种基于划分的文本聚类的算法,在许多方面得到应用。但是该算法存在一些缺点,初始聚类中心的选择是随机的,并且该算法易于终止于局部最优,因此这会影响该算法产生的聚类效果。
细菌觅食优化算法是一种仿生优化算法,模拟大肠杆菌觅食的行为提出的,主要包括趋化、复制和迁徙等操作。本文就是将细菌觅食优化算法结合k-medoids算法应用在文本聚类中,用来改进k-medoids 方法,利用细菌觅食优化算法的全局寻优功能寻找最佳的初始聚类中心,从而克服了k-medoids 初始聚类中心随机选择的缺点,并能跳出局部最优。通过实验证明了本文方法的可行性。