隶属度放缩模糊c均值聚类算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:smeie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模糊c均值(FCM)是最常用的聚类方法之一。但是,随着数据量的增加,FCM的距离计算是非常繁琐的,因为所有样本都参与每次迭代更新而没有考虑当前的聚类结果,所以导致FCM的收敛速度慢且计算量大。针对上述问题,本文基于隶属于聚类中心v的样本有助于v的收敛而其余样本阻止v的收敛的观察,提出一种新的隶属度缩放FCM算法(MSFCM)。本文所取得研究成果主要有:第一,研究分析了 FCM的迭代过程,本文给出了两个FCM的新发现。第一个新发现:基于FCM迭代公式的单调性,给出了隶属度的上下界;第二个新发现:通过简单的人工试验,本文观察到在FCM中,隶属于聚类中心v的样本有助于v的收敛而其余样本阻止v的收敛的现象。第二,基于这些FCM的新发现,本文提出了一种隶属度放缩FCM算法(MSFCM),并将三角不等式首次应用到模糊聚类中。此算法利用三角不等式筛选出下一次迭代后,所隶属的聚类中心不变的数据点;然后提出了一种用于放缩所选样本的隶属度的新技巧,在聚类过程中以增强簇类样本的效果并减弱簇外样本的效果。这个新技巧不仅极大地提升了算法的收敛速度,而且保持了较高的聚类质量。实验结果表明,所提出的算法在迭代次数、训练时间和聚类效果等方面比最新的模糊聚类算法更有效或具有可比性。特别地,与FCM相比,MSFCM节省了至少三分之二的总迭代次数,而不会显著地增加每次迭代的成本。第三,基于这些FCM的新发现,本文提出了新的一种隶属度放缩FCM算法,称之为全局隶属度放缩FCM算法(GMSFCM)。此算法基于本文给出的第二个FCM的新发现,结合隶属度的上下界,每一次迭代,将全部样本分为两类,但是将样本点分类过程中,需要大量的距离计算。因此,再次将三角不等式引入,从而减少大量没有必要的距离计算。实验证明,GMSFCM算法是有效的。最后,对隶属度放缩FCM算法(MSFCM)和全局隶属度放缩FCM算法(GMSFCM)的性能进行细节的分析。实验结果表明,在理论支撑下,MSFCM算法和GMSFCM算法是更有效的。因此,说明了隶属度放缩FCM算法(MSFCM)和全局隶属度放缩FCM算法(GMSFCM)是模糊聚类的很好的补充。
其他文献
21世纪初,中国的城市化进程呈逐年递增趋势,截止2019年,中国的城市化率已达五成以上,这意味着中国的城市化迈入了一个新的历史阶段。2015年牡丹江市对A社区进行了初步网格化,
太赫兹波位于微波段和光波段之间,当前没有大规模的应用,本文主要以太赫兹波的应用为背景,通过理论计算和实验测量两种方式对目标太赫兹散射特性进行研究,揭示太赫兹频段目标散射特性的影响因素。针对常见算例利用不同的计算方法,由于太赫兹频段的特殊性,主要从电磁方法和光学方法两个方面对其散射特性进行研究,为太赫兹频段目标电磁散射提供仿真和测试两方面的数据支持,具有一定的理论和应用价值。本文创新性的给出太赫兹频
现代移动通信以第一代移动通信技术的发明为标志,在经历爆发式增长后,对人们的生活方式产生巨大的影响。如今,移动通信渗透到生活的方方面面,成为推动社会发展的重要因素之一。5G作为新一代移动通信技术,将广泛应用于增强移动带宽(enhanced Mobile BroadBand,eMBB)、高可靠低时延通信(Ultra-reliable and Low Latency Communication,URLL
无线通信技术的快速发展,促使了各类新型应用的产生,运营商提供的服务类型也在飞速的扩展,如短视频、在线直播等等,此时服务类型由传统的“以连接为中心”的服务转变为了“以内容为中心”的服务。这些服务需求不仅有高数据传输效率、低传输时延的要求,同时也需要大量的计算能力和持续的数据处理能力。要想最大化利用有限的无线频谱资源,优秀的资源分配算法是提高整个网络性能的关键,而传统的资源分配算法很难同时满足这些需求
随着城市居民的生活品质和电气化程度的逐渐提高,作为与电网用户联系最为紧密的配电网的建设与发展,在新时代背景下面临着诸多的问题与挑战。配电网重构不仅作为提高系统电能质量、供电可靠性与灵活性的重要手段,也在减小网络损耗、提高运行经济性等方面发挥着关键作用。由于分布式电源(Distributed generation,DG)具有良好的环境效益和经济效益,DG已被广泛地应用于配电网中,但是随之而来的功率倒
随着人工智能的高速发展,自然语言处理等计算机技术获得了极大关注,具有很强的研究潜力。文本生成在自然语言处理领域有着重要意义,高质量的文本对于对话系统、智能翻译、文学写作、知识图谱等与自然语言处理相关的任务具有重要影响作用。文本数据由于自身的离散性和语义结构自身的复杂性,容易出现文本训练数据样本数量少、质量差、样本缺失等难题。现有的文本生成技术的研究已经有了较大的进展,但是仍存在着一定的局限性。例如
日常生活中存在着很多二分网络结构,譬如用户-域名网络,云服务中相互承载的源IP-域名网络等等。二分网络中存在着社团结构,基于社团结构的网络分析比基于节点的网络分析更为高效。同时,社团结构的发现可以检测出匿名网络中潜在的威胁,这对二分网络的管理以及分析意义重大。但是随着大数据时代的降临,企业每天产生的日志量呈爆炸式的增长,传统的社团发现方法并不能适用于长时间尺度内海量的日志数据,这使得对长时间尺度内
分数阶最优控制问题由于其在地下水污染等实际问题中的广泛应用,在理论模型和数值方法方面的研究得到了越来越多的关注.本文主要研究两类控制积分约束的空间分数阶最优控制问
汽车已经成为人们生活中不可或缺的一部分,而汽车拥有量的急剧增加使得交通拥堵、交通安全、空气污染等问题愈加严重。人们逐渐将路径规划、行车安全、网络互娱等元素加入到汽车产业当中。在这样的需求条件下,智能交通系统(ITS,Intelligent Transportation System)的发展迫在眉睫。车联网技术作为智能交通系统中最重要的组成部分,主要包括车辆与路旁基础设施(V2I,Vehicle t
给定一个图(G=(V,E),图G的正常染色是指对G的每个顶点(边)分配一种颜色,使得相邻的两个顶点(边)染不同的颜色.满足图G是正常m-可染的最小正整数m,称为图G的色数(边色数),记为