基于模糊集合理论的聚类算法研究与应用

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:spcheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘的重要分支之一,引入模糊集合理论的模糊聚类分析为现实数据提供了模糊处理能力,在许多领域被广泛应用。在本文中,详细地分析了被广泛使用的DBSCAN聚类算法和K-means聚类算法的原理及其优缺点。在介绍了模糊集合的基本理论知识之后总结了模糊聚类的原则和通用的方法,并详细分析FCM算法的特点。  FCM算法是目前广泛应用的模糊聚类算法,但由于该算法是以c-均值(也即K-means算法)算法为基础,因此FCM算法也具有与c-均值算法类似的缺点,对初始聚类中心的依赖性比较强。若初始聚类中心取值不当,则算法的目标函数可能收敛到局部极小值,得不到最佳的聚类结果,有时甚至是错误的聚类结果。为了改进聚类算法的性能,避免算法因初始值的影响而收敛到局部极小值的问题本文针对聚类算法所要处理的数据特征,提出一种非线性投影寻踪方法用来确定初始聚类中心使算法收敛速度更加快速,聚类结果更加可靠。投影寻踪是一种线性的数据降维方法。本文中所述的非线性投影寻踪是一种改进的非线性的数据降维方法,该方法把二维散点图数据通过非线性映射函数映射为一维的直方图数据并保留原始数据的本质数据特征。从直方图中可以获取初始聚类中心信息,由于初始中心接近于真实的聚类中心,因此算法的收敛速度更快、结果更可靠。  通过在血液细胞分析仪上的聚类应用表明,本文所采用的通过非线性投影寻踪对散点图数据进行初步区域划分确定初始聚类中心,然后将初始聚类中心应用到模糊聚类分析中具有较好的聚类效果。
其他文献
本论文从水流运动的最根本机理出发,对溃坝的高分辨率数值模拟进行了研究。在有限差分法、有限单元法、有限体积法等各种浅水数值模拟方法中,分析了的它们各自优缺点,并选择对任
“教育是农业,而不是工业!”无论是知识的汲取,还是思维的养成,或是思想的成长,每个学生都有着相对稳定的生命轨迹。然而,在现实的教育教学实践中,由于社会就业压力的传导,现
新课程改革正在如火如荼地进行,“一切为了学生的发展”的理念已成为我们每一个教师在教学过程中都应具备的教育思想。新《地理课程标准》的“面向全体学生,注重素质教育”的
本文主要做了三方面的工作。  在第一部分,我们介绍了一类三角矩阵代数,其中的每个代数叫做一个正规三角矩阵代数。我们刻画了这类代数的Gorenstein投射模。并且给出了正规三
近年来,我们临县县委组织部按照“三个代表”要求,以夯实党建基础工作、保持党的先进性、充分发挥党员先锋模范作用为目标,积极探索新形势下加强党员管理的新途径、新方法,在
桂丰A是广西农业科学院水稻研究所以自选保持系H14(IR58025B×金23B)为母本与粤泰B杂交,后代再与博A测交并连续回交转育而成的水稻不育系,具有穗大粒多、不包颈、败育彻底、
人工神经网络是目前国内外学者广为关注的一个相当活跃的研究领域,递归神经网络作为人工神经网络的一种重要类型它在智能控制、模式识别、图像处理非线性优化计算、传感技术
新课标指出“高中英语课外实践活动对当前我国社会发展和经济建设对公民的外语素质提出了更高的要求。高中阶段的外语教育是培养公民外语素质的重要过程,它既要满足学生心智和
《数学课程标准》明确指出:“学习内容的呈现应采用不同的表达方式,以满足多样化的学习需求。”新课程提倡教材的多样性、趣味性、生活化和情境化,这是符合学生年龄特点和认
2002年,刘宝碇提出了随机模糊变量的概念,随机模糊变量定义为从可信性空间到随机变量集合的函数。在随后的时间里,得到了越来越多学者的重视,并取得了丰硕的成果。如朱元国和刘宝