论文部分内容阅读
能否及早地跳出早熟直接影响到粒子群算法(PSO)的优化效果,并且初始聚类中心的优劣、数据分布是否平衡和多维数据中每个属性对聚类的重要性程度将直接影响到模糊 C均值(FCM)算法的聚类效果。论文针对PSO和FCM各自的缺点提出了两种改进模型,双阈值定标的PSO模型和动态权重的FCM聚类模型。然后将两种模型结合起来,先用双阈值定标的PSO模型得到全局最优的初始聚类中心,再用动态权重的FCM聚类算法得到最后的聚类结果。
双阈值定标的PSO考虑了在基本PSO算法后期超常个体作为gbest(全局极值)有可能很快控制整个群体的运动行为,影响算法的全局优化性能,从而失去了粒子间解的多样性。采用指数定标(适当地降低或提升适应度值的差异)可以解决这个问题。在使用定标后某粒子在一定次数内还是被选作全局最优个体就可视为是最优解,因此在没达到最大迭代次数之前就可以停止算法,采用双阈值可能达到提前结束迭代的目的。
针对基本FCM聚类算法不能很好的处理有噪声和数据不平衡等问题,有人提出了一种固定权重FCM算法(WAFCM)。本文考虑到属性的不同重要性对聚类效果有影响,用动态权重替换了固定权重,动态权重的FCM聚类模型可以根据具体的目标,采用合适的方法给属性赋以合适的权重值,最后获得更好的聚类效果。
将上面两种改进的算法结合起来就得到了最后的聚类模型,通过数值实验证明此聚类模型的聚类效果,有良好的抗噪声能力、有较低的错分率。