论文部分内容阅读
模糊C-均值(FCM)聚类算法是非监督模式识别中应用最为广泛的算法之一.该算法基于最小平方误差,并规定了每个样本对各类隶属度的和为1,这使得样本的典型性反映不出来,不适用于有噪声、离群点、分布不均衡样本的情况.为了克服这些缺点,本文着重从以下几个方面对FCM加以改进:
(1)引入一种新的非欧式距离:d2(x,y)=i-exp(-β||x-y||2);放松归一化条件,使所有样本对各类的隶属度总和为N.改善了离群点和样本不均衡问题对聚类结果的影响.
(2)采用高斯核函数方法,把输入空间映射到高维特征空间,使得在输入空间中线性不可分的样本线性可分,然后在特征空间中聚类.
(3)将核方法和改进的FCM算法相结合,提出一种新的聚类算法.
实验结果表明,本论文提出的算法具有可行性和有效性.