论文部分内容阅读
针对传统K—means算法的聚类结果依赖初始聚类中心的缺陷,提出了一种基于密度的改进K—means聚类算法.该算法选择位于数据集样本密集区且相距较远的数据对象作为初始聚类中心,实现K—means聚类。针对PAM算法时间复杂度高,且不利于大数据集处理的缺陷,提出了一种基于密度的改进K—medoids聚类算法,在选取初始中心点时根据数据集样本的分布特征选取.使得初始中心点位于不同类簇。UCI机器学习数据库数据集和随机生成的带有噪音点的人工模拟数据集的实验测试证明.基于密度的改进K—means算法和基于密度的改