基于网格和密度的聚类算法研究

来源 :长沙理工大学 | 被引量 : 6次 | 上传用户:peng88888888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于网格和密度的聚类算法速度快,能发现任意形状的簇,适于空间数据的聚类。但现有的基于网格和密度的聚类算法往往要求用户输入网格粒度和密度阈值这两个参数,这加重了用户的负担,并且导致聚类结果不可控。网格粒度决定了观察数据所用的分辨率,从而基本上决定了聚类的结果;同时网格的大小还影响到聚类的速度。现有算法在处理网格粒度和密度阈值时,多数是根据数据点总数以及平均密度等统计量,利用一个经验公式求得这两个参数,比较简单化。在分析聚类分析主要算法特别是其对网格粒度和密度阈值的处理方法的基础上,首先提出了在给定密度阈值条件下,密网格最多时网格粒度最优的观点。在此基础上,提出了在给定一组密度阈值条件下,根据密网格最多原则以及网格划分中密网格和稀疏网格的产生情况确定最佳密度阈值和网格粒度的方法。用该方法得到的网格粒度既能反映数据的内部结构,同时又不致陷入到琐碎的局部细节中去,其粒度对于聚类分析是合适的,是对数据的一种很好的压缩。这种方法大大减轻了用户对领域知识的需求,基本实现了无参聚类。实验表明,这种方法速度快,能发现空间数据的主要聚类结构。
其他文献
无线传感器网络涉及到嵌入式系统、计算机网络、无线通信技术以及信息处理技术等多个领域,是一种跨学科的综合技术,在军事、农业、医疗健康、应急救援以及环境监测等领域有着广
一直以来,传统的医疗监护方式都是被监护人在医院接受医生和护士的监护,但这种方式不仅占用了有限的医疗资源,设备之间复杂的连线给病人和医院也带来了诸多不便。另外,中国现
随着Internet技术的快速发展,越来越多的领域采用网络地理信息系统(WebGIS)作为其展示和处理空间信息的手段,它改变了地理信息的获取、传输、发布、共享和应用的方式。网络地
随着无线传感器网络技术的发展和感知矿山的提出,把物联网技术应用到感知矿山中已经成为了当务之急。本课题来源于徐矿集团夹河煤矿感知矿山示范工程。无线传感器节点体积小,安
随着无线传感器网络的不断发展,感知数据的查询处理技术已经成为各个应用领域的关键技术,其目的是给用户提供所需要的各种数据。由于传感器节点独有的特点,查询处理技术研究的主
目前,难加工材料已经广泛应用到航空航天、船舶、核能、兵器制造等领域,然而,由于难加工材料加工工艺知识具有复杂性、多样性、经验性和不确定性等特点,长期以来,如何完善工艺知识
随着社会经济的迅速发展,人们对水资源的要求和依赖程度越来越高。由于人类社会在高速发展过程中对水资源的掠夺式开采和不合理使用,加之水资源自身的有限性和不均匀性,使得水资
Internet中的网络主要依赖于有线网络,是目前世界上最大,应用最广的计算机网络。随着微电子技术的兴起以及军事应用等其他领域应用的需要,一类新的网络形式开始出现,这类网络
高等职业技术教育是面向就业,以实践能力为重点的教育类型。校园网是职业院校开展招生、教学、管理、就业以及后勤服务的基础设施。改善校园网可以有效的提高职业院校的工作
随着语义网技术的快速发展和信息抽取技术的不断进步,对应生成RDF数据的速度也变得越来越快,常见的RDF数据集中包含的三元组条数已达到亿级的数量单位。面对如此规模的RDF数据,