论文部分内容阅读
针对模糊C-均值聚类算法偏好发现球形簇,以及对孤立点非常敏感的问题,提出了密集簇中心二次模糊聚类算法,其中引入聚类有效性度量函数,并进行了有效的孤立点处理,最终的模糊簇由多个代表点共同表示,故算法可有效发现数据集中的自然簇数目,对簇的大小和形状没有偏好性,且在孤立点的处理上具有较好的健壮性。另外,随机采样过程方便地实现了上述算法在大型数据集上的扩展;与模糊C-均值聚类算法的实验结果比较也表明了该算法的优越性。