基于最小生成树的聚类算法研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:onlymeley
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着聚类算法应用领域的扩大,可处理的数据类型日趋丰富,基于图论的聚类方法引起越来越多的关注,新的和改进的算法不断被提出。但是,新的应用需求层出不穷、不断变化,且现有的方法也存在不足,因此要对现有方法进行改进,提出新的理论和方法以满足新应用的需求。本文通过对基于最小生成树(Minimum Spanning Tree,MST)的聚类算法的研究分析,发现该算法在执行的过程中利用贪心算法生成MST,算法的判定过程较复杂,存在大量的冗余信息。当数据量较大时,算法运行所需时间较长,算法在时间性能上是低效的。此外,噪声数据对算法效果的影响较大。这些缺陷在一定程度上限制了算法的应用。针对上述问题,本研究结合网格技术和粗糙集理论提出了一种基于MST聚类的快速算法。该算法在基于MST的聚类中引入网格的概念,根据粗糙集理论给出网格的下确界和上确界,创建边界可扩展的粗糙网格。接着,将每个网格单元作为执行MST生成算法的独立单元,构造每个网格的MST。结合高斯分布特征规律,依据得到的MST边长分布特征删除噪声网格,根据本研究中给出的合并定理合并近邻网格进行聚类。本文提出的算法可以视为一个算法框架,各种生成MST的算法(如,最常用的Kruskal算法和Prim算法)都可以与其结合以减少运行时间。实验结果表明,本文提出的算法计算效率较高,且准确率接近传统的基于MST的聚类算法,算法在大规模数据集的应用中性能良好。
其他文献
覆盖问题是计算几何和组合优化领域中的一类重要的难解问题,对此类问题的研究不但具有重大的理论意义,而且在生物计算、电路设计、网络选址、工艺流程分析等应用领域具有许多
随着无线通信技术的发展,通信中对其所传输信号的要求日益增高,天线技术也随之不断优化革新。相控阵天线具有波束灵活性、自适应模式的优点,并能同时监视跟踪目标,以上特性使
采用压缩感知理论进行信道估计的前提是信道本身为稀疏的,或者可以通过少许几个基函数进行稀疏表示。目前,大部分应用于信道稀疏表示的字典由某组固定的正交基函数系列所构成,不能用少量的基函数对信道进行表示。为此,本文引入Takenaka-Malmquist(TM)函数系,研究与信道结构相匹配的TM字典的构造和学习方法,发展自适应匹配无线信道的稀疏表示方法。主要工作和创新点如下:首先,提出了一种基于修正解析
依法治国是我国治国安邦的基本方略,要想尽快在我国庞大的人口体系下有效地推行依法治国方略,最有效的方法必然是通过教育手段。2014年,十八届四中全会在北京召开,该会议通过了《关于全面推进依法治国若干重大问题的决定》,决定中提到,“要想推动全社会树立法治意识,就要把法治教育纳入国民教育体系中,要从青少年抓起,要在基础教育中设立法治教育课程。”在基础教育课程改革的指导下,起到德育作用的思想品德课顺理成章
纳米网络(Nanonetworks)是指由大量的、尺寸在纳米级或微米级的通信设备相互连接而组成的网络。由于单个纳米组件的尺寸只有约几立方纳米,因而其拥有了纳米尺度上的新特性,在生物医学、环境检测、国防军事以及工业和消费品等领域均有着十分广泛的应用前景。近年来,随着碳纳米管、石墨烯等新型纳米材料的出现,为高工作频率的电磁波通信提供了新的解决方案,使得纳米天线可以有效地辐射太赫兹(Terahertz,
随着众多新兴应用的出现,例如超高清视频、智能家居、云计算、虚拟现实等,网络流量呈现爆炸式增长。2013年8月,中国正式提出了“宽带中国”战略,将宽带网络作为国家战略性公
随着市场经济的日趋成熟,中小企业已经成为了促进国民经济水平实现增长的重要主体,在整个社会经济发展的过程中发挥了至关重要的作用,为社会提供了大量就业岗位的同时,注入了
随着计算机技术和移动互联网的发展,智能移动终端已成为大众上网的主要设备,极大地改善了人们的生活。在智能移动终端上,各种基于位置服务的应用应运而生并日渐丰富,着实为用户带来了诸多便利。顾名思义,基于位置服务的应用需要获取用户位置信息来进行服务,而位置信息常可以与其他信息如时间或用户身份等相关联,应用可以进而推知用户的隐私信息。如根据用户夜间常在地可以推测用户住址、根据用户日间所处位置可以推测用户工作
低轨卫星系统近年来受到国内外广泛关注,各国都在努力部署低轨卫星星座系统,低轨卫星通信系统中功率受限,因此需要一种纠错能力较强的信道编码方案。卫星选择信道编码方案时应将卫星实际情况与编码复杂度等因素结合起来进行综合考虑,从而确定适宜的编码方法和对应的解码方法。由于低解码复杂度和并行解码,同时为了顺应5G与卫星融合的趋势,卫星应更多使用地面5G现有基站资源,LDPC(Low Density Parit
磁场是地球的基本属性之一。在地震预测领域地磁异常作为可能成为孕震的标志,国家地磁台网通过建设台站将专业设备采集到的高精度地磁场要素数据公布,以促进相关领域的研究。而通过台站作为地磁源数据获取手段有其局限性:一、对于短周期的地磁异常,台网的数据订阅式共享对于用户缺乏有效的机制为获取异常时间点附近的细节数据提供支持。二、目前地磁台站最短采集间隔为1/32秒,大多数台站为1秒,对于毫秒级甚至更低的采集间