论文部分内容阅读
模式识别技术是人工智能的重要研究内容。基于各种技术,几十年来各种不同的模式识别方法得到了广泛的研究与应用。在当今飞速发展的数据挖掘和探查性数据分析中,聚类分析技术已广泛应用于模式识别、图像处理、生物、心理、计算机视觉和遥感等领域。在实际问题中,已有的各种聚类算法各有其优势,如何提高聚类算法的抗噪声能力和鲁棒性能,以及如何针对不同的数据集寻找最优的聚类方法,并给出合理的解释,成为众多学者正致力于研究并解决的问题。本文针对目前聚类算法及其应用中的一些热点问题展开了研究与探讨工作,主要的工作分为以下三部分:第二章提出了一般化的改进模糊划分的FCM聚类算法GIFP-FCM (Generalized Fuzzy C-Means Clustering with Improved Fuzzy Partitions),通过引入新的隶属度约束,解决了IFP-FCM (Improved Fuzzy Partitions for FCM algorithm)算法模糊指数m的一般化问题;同时GIFP-FCM算法从Voronoi距离和竞争学习的角度对其鲁棒性和快速收敛性进行了合理解释;其次,通过引入模糊程度系数α,使得FCM算法和IFP-FCM算法分别表示为GIFP-FCM算法在α等于0和α趋于1时的特例。实验结果表明GIFP-FCM算法较之于IFP-FCM和FCM算法具有更好的鲁棒性和参数适应性;在纹理图像分割中,GIFP-FCM也明显优于IFP-FCM和FCM算法。第三章根据文本数据具有方向性数据的特征,可利用方向数据的知识完成对文本数据聚类,提出了模糊方向相似性聚类算法FDSC (Fuzzy Directional Similarity Clustering),继而从竞争学习角度,通过引入隶属度约束函数,并根据拉格朗日优化理论推导出鲁棒的模糊方向相似性聚类算法RFDSC(Robust Fuzzy Directional Similarity Clustering)。实验结果表明RFDSC算法能够快速有效的应用于数据挖掘及文本聚类中。第四章针对K平面聚类算法KPC (K-Plane Clustering)对噪声点敏感的缺陷,通过引入隶属度约束函数,推导出鲁棒的改进分割K平面聚类算法IFP-KPC (Improved Fuzzy Partitions for K-Plane Clustering),并利用Voronoi距离对IFP-KPC算法的鲁棒性进行了合理解释。实验结果表明IFP-KPC算法与KPC算法相比具有更好的聚类效果。