基于层次的模糊聚类算法

来源 :青岛大学 | 被引量 : 0次 | 上传用户:huili1012
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是数据挖掘的重要分支之一,引入模糊理论的模糊聚类分析为现实数据集提供了模糊处理能力,在许多领域被广泛应用。本文在对基于划分的模糊聚类算法中模糊C均值聚类算法及其变种算法进行分析的基础上,围绕不同分布复杂度和数据量的数据集聚类及其输入参数问题进行了较深入的探讨,提出了密集簇中心二次模糊聚类算法SFCC和基于动态模型的分层模糊聚类算法DMFC两个基于层次的模糊聚类算法。基于FCM算法、SFCC及DMFC算法,本研究工作对基于层次的模糊聚类过程进行了模块化描述。 密集簇中心二次模糊聚类算法中引入聚类有效性度量,避免聚类簇数目作为输入参数,不再偏好发现球形和相似大小的簇分布;为进一步提高算法的模糊聚类能力,提出了基于动态模型的分层模糊聚类算法,该算法基于k-最近邻居图的构造和划分,合并过程中综合考虑簇间的整体相似度和内在结构的相似性,在分布复杂的数据集上有较强的模糊聚类能力。 针对FCM算法、SFCC及DMFC算法这三类算法的具体实现,对比给出不同数据量及分布复杂度的数据集模糊聚类结果,经实验结果可视化对照及时间复杂度分析,表明本研究工作提出的SFCC算法与DMFC算法在不显著增加时间复杂度的前提下,对分布复杂的数据集具有较高的模糊聚类能力。
其他文献
信息网络时代的到来给国家政府部门的工作提出了快捷、高效的要求,发展电子政务已是大势所趋。但是目前的电子政务系统在面临着很多问题,其中一个主要的难题就是信息源异构问题
传统的数据库安全机制对于成功数据攻击的防御能力非常有限,有授权的恶意事务可以通过破坏数据的完整性和可用性使得数据库系统不能正常工作。因此,入侵检测技术被用来加强系统
软件测试是软件质量保证的重要手段。随着互联网技术的普及,软件产品已从传统的单机环境迁移到复杂多变的网络环境。因此,研究如何对网络软件进行测试是软件测试领域的一个重
随着Internet的持续快速发展,人们对网络的需求由简单的数据传输向综合的多媒体业务发展。多播技术作为一种可大大节省网络资源的技术在多媒体业务中有着广泛的应用。很多实时
随着企业信息化的发展,企业越来越依赖于网络,Intranet中的关乎企业利益的安全问题越来越受到更到的关注。而如何能够有效地保障网络中这些与企业息息相关的重要数据信息的安全
本文针对XX部机关局域网的安全要求,提出了一套系统、先进和科学合理的网络安全整体解决方案,包括内部网络的安全、远程接入的安全、连接外部网络的安全以及操作系统安全、应用
分布式一致性是指n个处理器组成的分布式系统,其中最多有m个处理器发生故障,要求所有的无故障处理器都能做出相同的决定,并且决定值必须是合理的。区域故障模型是多个局域网中处
互联网的发展为全球范围内实现高效的资源和信息共享提供了方便,同时也对网络安全防护提出了新的挑战。网络入侵检测技术作为一种积极主动的安全防护技术正成为目前网络安全领
不断发生的瓦斯灾害事故带来的是巨大的生命和财产损失,为了让悲剧能够谢幕,我国也在不断地利用计算机等新兴高科技技术来推动瓦斯抽采监测系统的发展。要提高煤矿瓦斯抽采效
基因组重组问题是计算生物学中的常见问题,基因组重组算法对分子生物学中生物进化的研究具有重要意义。早在六十年前,Dobzhansky和Sturtevant发表了一篇重要论文,证明了两种不同