基于模糊集合理论的聚类算法研究与应用

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：spcheng

【摘要】

：

聚类分析是数据挖掘的重要分支之一，引入模糊集合理论的模糊聚类分析为现实数据提供了模糊处理能力，在许多领域被广泛应用。在本文中，详细地分析了被广泛使用的DBSCAN聚类算法和

【作者】

：

聂志华

【机构】

：

哈尔滨工业大学

【出处】

：

哈尔滨工业大学

【发表日期】

：

2008年期

【关键词】

：

模糊集合理论聚类算法非线性投影寻踪散点图数据血液细胞分析仪

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

聚类分析是数据挖掘的重要分支之一，引入模糊集合理论的模糊聚类分析为现实数据提供了模糊处理能力，在许多领域被广泛应用。在本文中，详细地分析了被广泛使用的DBSCAN聚类算法和K-means聚类算法的原理及其优缺点。在介绍了模糊集合的基本理论知识之后总结了模糊聚类的原则和通用的方法，并详细分析FCM算法的特点。　　FCM算法是目前广泛应用的模糊聚类算法，但由于该算法是以c-均值（也即K-means算法）算法为基础，因此FCM算法也具有与c-均值算法类似的缺点，对初始聚类中心的依赖性比较强。若初始聚类中心取值不当，则算法的目标函数可能收敛到局部极小值，得不到最佳的聚类结果，有时甚至是错误的聚类结果。为了改进聚类算法的性能，避免算法因初始值的影响而收敛到局部极小值的问题本文针对聚类算法所要处理的数据特征，提出一种非线性投影寻踪方法用来确定初始聚类中心使算法收敛速度更加快速，聚类结果更加可靠。投影寻踪是一种线性的数据降维方法。本文中所述的非线性投影寻踪是一种改进的非线性的数据降维方法，该方法把二维散点图数据通过非线性映射函数映射为一维的直方图数据并保留原始数据的本质数据特征。从直方图中可以获取初始聚类中心信息，由于初始中心接近于真实的聚类中心，因此算法的收敛速度更快、结果更可靠。　　通过在血液细胞分析仪上的聚类应用表明，本文所采用的通过非线性投影寻踪对散点图数据进行初步区域划分确定初始聚类中心，然后将初始聚类中心应用到模糊聚类分析中具有较好的聚类效果。

其他文献

溃坝水流的WENO有限体积格式数值模拟研究

本论文从水流运动的最根本机理出发，对溃坝的高分辨率数值模拟进行了研究。在有限差分法、有限单元法、有限体积法等各种浅水数值模拟方法中，分析了的它们各自优缺点，并选择对任

学位

大坝事故分析溃坝水流运动有限体积格式数值模拟应用数学

三角矩阵代数的表示论

本文主要做了三方面的工作。　　在第一部分，我们介绍了一类三角矩阵代数，其中的每个代数叫做一个正规三角矩阵代数。我们刻画了这类代数的Gorenstein投射模。并且给出了正规三

学位

三角矩阵代数Gorenstein投射模反射函子表示论APR-倾斜模

建立党内基本信息管理系统的作法与经验

近年来,我们临县县委组织部按照“三个代表”要求,以夯实党建基础工作、保持党的先进性、充分发挥党员先锋模范作用为目标,积极探索新形势下加强党员管理的新途径、新方法,在

期刊

信息管理系统入党志愿书先锋模范作用统计工作从严治党基层党组织基层党委规范化水平县委组织部信息系统

时滞静态神经网络模型的全局动力行为研究

人工神经网络是目前国内外学者广为关注的一个相当活跃的研究领域,递归神经网络作为人工神经网络的一种重要类型它在智能控制、模式识别、图像处理非线性优化计算、传感技术

学位

变时滞S-分布时滞静态神经网络全局指数鲁棒稳定性全局指数稳定性拓扑度学习算法

随机模糊变量特征函数的若干性质

2002年，刘宝碇提出了随机模糊变量的概念，随机模糊变量定义为从可信性空间到随机变量集合的函数。在随后的时间里，得到了越来越多学者的重视，并取得了丰硕的成果。如朱元国和刘宝

学位

随机变量随机模糊泰勒展式极限定理

基于模糊集合理论的聚类算法研究与应用

其他学术论文