基于网格划分的非球形聚类算法研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:jiangwei521521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
按照聚类模式的不同,聚类算法可以分为球形聚类算法和非球形聚类算法。非球形聚类算法指的是自动检测数据中的任意形状类。最具代表性的非球形聚类算法是DBSCAN算法。DBSCAN算法可以识别任意形状的聚类,但是该算法对密度参数十分敏感。由于空间数据可以通过网格进行预划分,有学者提出在网格划分的基础上对数据进行聚类分析。然而,这类方法对网格划分的要求十分严格,不同的网格粒度会产生差异明显的聚类结果。并且当数据维度过高时,基于网格划分的方法严重受限于维数灾难问题。为解决上述问题,本文提出了基于网格划分的非球形聚类算法。区别于传统的DBSCAN算法和基于网格划分的聚类算法,论文提出的聚类算法分为三个步骤实现:自适应网格生成、高密度区域凝聚聚类以及稀疏区域类别确定。论文首先给出了一种网格宽度的自适应确定方法,该方法可以得到一种近似最优的网格结构。在得到网格结构后,非球形聚类包括高密度网格凝聚聚类和低密度网格均值漂移融合。该方法能够有效地判定边界区域的聚类类别,并且可以检测出密度较小的稀疏类簇。另外,论文提出了一种基于多子空间结构的非球形聚类算法,把论文提出的聚类算法从低维数据扩展到较高维度的数据。论文在4个构造数据集和4个真实数据集上进行了数值实验,分析了算法的参数和性能。为了说明算法的有效性,论文与经典聚类算法进行了一些实验对比,说明本文算法在运行时间、聚类准确度和算法可扩展性等方面具备一些优势。
其他文献
本文首先介绍了知识产权证券化的背景,明确品牌知识产权证券化模式探讨的目的,通过几个可以借鉴的方面进行创新探讨。本文接着对品牌证券化的几个关联基本概念进行了文献综述
学位
栈溢出是当前最流行的计算机系统攻击手段之一,近几十年来人们对栈溢出进行了许多深入的研究,并基于不同的思路提出了不同的栈溢出检测防御技术。现有的栈溢出检测技术总体可
违约预测是对债务偿还风险的预测,违约预测模型可以帮助投资者识别投资过程的违约风险,并为银行的信贷决策和公司债券股票的投资决策提供支持。本文的第一章是绪论,第二章是不一致客户变换与违约预测模型的基本原理,第三章是违约风险预测模型的构建,第四章是基于中国上市公司样本的实证分析,第五章是结论。本文的研究重点包括:一是不一致客户的识别与处理。不一致客户是其指标向量的数值与违约客户指标向量的数值相近,但目前
异体肌腱是ACL重建移植物选项之一。本实验通过对比自体肌腱、深低温冷冻异体肌腱、冻干异体肌腱重建ACL术后移植物生物学转化和腱骨愈合进程的动物实验研究,为同种异体移植物选择及术后康复提供组织学依据。新西兰兔共80只,随机选取20只获取双侧后腿趾长屈肌腱(FDL)共40根,经深低温冷冻及冻干后制备成深冻肌腱和冻干肌腱各20根。剩余60只兔随机平均分为自体组、深冻组、冻干组,每组20只,分别用相应移植
Web测试的重要性逐步被大家认识到,人们在注重开发的同时也开始注重测试。然而,参与测试的人员的技能水平与工作态度是不定的,选择哪些人来参与测试将会直接影响到测试结果的
为研究外源胰岛素注射对不同鸡种采食及血糖代谢物和相关基因表达效应的影响,本实验包含以下三个试验:试验一外源胰岛素注射对不同品种鸡血糖浓度和采食情况的影响本试验旨在探究注射胰岛素对不同品种鸡血糖浓度和采食情况的影响。研究包含两个部分,试验鸡只包含蛋鸡、乌鸡和肉鸡,且均为公鸡,自由采食和自由饮水,试验前禁食16 h。第一部分选用21 d的蛋鸡、乌鸡和肉鸡各120只,随机各分为4组:胰岛素禁食组(n=1
世界经济一直面临各种冲击,这些冲击常常从经济周期的变化反映出来。当前,世界经济比以往任何时候更加相互依赖。经济政策、商品价格或消费趋势的细微变化都将对经济产生不同
频率源是电子系统的核心部件,在航天、医疗、无线测控、国防事业和无线通信中都有着非常重要的作用。随着电子技术的不断发展,各系统对频率源的性能指标要求也越来越高,低相噪、小型化、低杂散、超宽带以及捷变频的频率源成为目前研究的重点和热点。其中相位噪声指标对各系统的影响尤为重要,它影响接收机信号接收灵敏度,通信系统的误码率和载频跟踪精度,雷达系统的目标发现能力等。本文研究设计了一种用于多普勒雷达系统的低相
电子邮件是当前社会主流的通信手段之一,是社会网络的一部分。一封电子邮件主要构成有邮件唯一标识,邮件的发送时间,邮件发送地址,邮件接收地址,邮件主题和邮件正文等。通过