基于DBSCAN的空间聚类算法研究与实现

来源 :云南大学 | 被引量 : 0次 | 上传用户:duyuh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类迈入到21世纪,空间数据挖掘技术有了极大的发展。在空间的数据的聚类分析算法中,基于密度的 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)和 St-DB SCAN(spatial-temporal Density-Based Spatial Clustering of Applications with Noise)算法,因其具有对数据库中数据点顺序不敏感并且能发现任意形状簇的优点,已被学者用来对昆明市出租车GPS数据的聚类,把握居民的出行规律,达到解决昆明市居民出行难的问题。但是DBSCAN算法存在对于大数据量聚类时,运行时间较长的问题。对于St-DBSCAN算法也存在处理空间对象分布倾斜时,算法的运行时间较长和聚类效果不理想的问题。本文基于这两点不足展开了相关研究工作。具体研究工作如下:(1)提出了按照象限划分方法改进DBSCAN算法。该方法首先以核心点为原点,将核心点的邻近点划分成不同的象限,然后根据每个象限区域内邻近点的点的个数和邻近点的是否偏离核心点,以每个象限点的重心点为代表性的点,完成聚类簇的拓展操作,改进了 DBSCAN 算法(QD-DBSCAN(Quadrant-Division Density-Based Spatial Clustering of Applications with Noise)算法)。(2)在本文中,首先通过对空间对象分布倾斜情况做了总结,得出空间对象分布会出现三种密度倾斜的情况,即核心点密度倾斜,边界点密度倾斜和噪声点密度倾斜。然后针对每一种密度倾斜出现的情形,以重心点转移为基本思想,提出了对应的改进方法,并描述了改进后的St-DBSCAN算法。(3)为了检测QD-DBSCAN算法和改进后的St-DBSCAN算法的时间性能和聚类效果,本文采用python语言实现了 QD-DBSCAN算法和改进后的St-DBSCAN算法,并在算法的时间效果和算法的聚类效果方面进行了比较,最后对实验的结果做了分析。通过实验表明:改进后的St-DBSCAN算法和QD-DBSCAN算法的时间性能和聚类效果方面有一定程度的提升,这些改进方法能够运用于实际的聚类中。
其他文献
我国是幽门螺杆菌(Helicobacter pylori,H.pylori)感染率较高的国家。儿童H.pylori感染不仅与消化性溃疡、慢性胃炎、胃癌等胃肠道疾病密切相关,还可能与多种胃肠道外疾病有
<正>商业银行信息科技外包通过引入成熟的产品平台和专业技术服务,快速响应市场需求,降低人力资源成本,同时也带来了敏感信息泄露、服务中断、响应不及时等风险,而且过度依赖
<正>1现阶段公变电费回收的状况1.1国网长沙供电公司公变电费管理的2种模式城区客户的电费管理方式分为两类:一是采取智能电费管理系统管理的客户群,电费结算周期为30天,停电
目的:探讨宫腔镜检查功血患者热球仪治疗后的效果。方法:对我院2007年至2008年2月以来采用热球子宫内膜治疗仪治疗功血的50例患者的诊治情况进行回顾性研究,分析术后6个月及1
村镇银行是我国深化农村金融改革的一项创新之举,为我国金融发展注入了"新鲜血液"。作为新型银行业金融机构,村镇银行本身存在着诸如成本高、成立时间短等弱点,同时面临着来
<正> 水性涂料的干燥过程比较复杂,影响的因素较多。但其基本过程无非是接受热量,水份蒸发,达到干燥。为便于讨论起见,首先对涂膜的能量平衡进行模拟,如图1所示。
多环吲哚是一类重要的含氮杂环化合物,不仅广泛存在于许多具有生理、药理活性的天然产物或药物分子中,而且还被认为是发现新型药物先导分子的“优势结构”,其化学合成一直吸
目的探讨在腹腔镜胆囊切除术(LC)全麻中一次性喉罩替代气管导管的安全性和可行性。方法择期行LC患者122例随机分为气管插管组(61例)和喉罩组(61例)。记录操作一次成功率、操
慢性荨麻疹是一种临床常见且容易复发的疾病,由于发病原因不易明确,病理机制目前仍没有清楚阐明故临床治疗效果不理想。现对荨麻疹的治疗进行综述,以帮助提高临床治疗的效果
随着社会经济不断进步与发展,在高校学生管理制度中都使用到了人性化的管理,并且人性化管理在管理工作上占据了很大的比重。那什么是人性化管理,人性化管理就是以人为本。就