基于密度聚类的空间数据挖掘算法研究

来源 :太原科技大学 | 被引量 : 0次 | 上传用户:wadfgh1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着空间数据获取技术的快速发展,空间数据的数量、大小和复杂性都在急剧增加,已经远远超出了人们的解释能力,致使“空间数据爆炸但知识贫乏”。因此,利用空间数据挖掘和知识发现从空间数据库中挖掘出事先未知的、却潜在有用的空间模式变得十分必要。然而由于空间数据的复杂性,及数据量的庞大,给空间数据挖掘带来了一定的难度。如何使用有效的数据挖掘手段从空间数据库中挖掘出有用的信息,是当前亟需解决的一大问题。本文在深入研究了国内外空间数据挖掘算法研究现状的基础上,比较与分析了现有空间数据挖掘算法,讨论了影响空间数据挖掘效率的空间索引技术,对基于密度聚类算法进行了研究与比较,并针对密度聚类算法对空间数据挖掘大量数据点处理上的时间复杂性及对参数的敏感性问题,提出了一种具有矢量约束侯选点的RCDBSCAN算法。该算法以传统的基于密度的聚类算法DBSCAN算法为基础,以发现线形聚类结构为目标,采用了矢量约束候选点的方法来进行候选点的选取,减少了数据点的处理;同时采用数据分区技术对数据集进行分区,再在各个分区进行密度聚类,降低了初始参数的敏感性;为了加快数据的存取速度,算法采用SS索引方法对数据进行访问。最后,采用国家地理研究所提供的太行山区空间地理数据对算法进行了实验验证,实验结果表明,本文提出的算法较传统DBSCAN算法在时间复杂度上有了较大的改进,同时对聚类簇边界点的处理收到良好的效果,为三维地形分析提供了有效的保证。
其他文献
软件测试是保证软件质量、提高软件可靠性的关键手段,是实施软件项目不可缺少的环节,其目的是以最少的时间和人力找出软件中潜伏的各种错误和缺陷。回归测试是软件测试的重要
协作学习(CollabomtiveLeaming,简称CL)是学习者以小组形式参与,为达到共同的学习目标,在一定的激励机制下为获得最大化个人和小组学习成果而进行的一切相关行为。基于Ontology
P2P技术已经使互联网格局发生了巨大的变化,改变了以往网络以服务器为中心的模式,使广大的互联网用户群体加入到网络共享的过程中来,有效的发掘了网络共享资源的潜力,为所有
惰性学习(Lazy Learner)分类法有别于决策树归纳、贝叶斯分类、基于规则的分类、后向传播分类等的急切学习分类技术。当给定训练集时,惰性学习法只是简单的存储它,而不像急切
目前,人们的工作和生活已经离不开嵌入式系统,各种各样的嵌入式设备例如移动终端、数字化设备、网络设备、各种传感器以及工业控制设备和办公自动化设备等被广泛应用,大大的提高
随着计算机技术的发展,软件系统尤其是基于网络实现的分布式应用系统应用越来越广泛,系统性能被列为系统质量的重要指标,并越来越受到人们的重视。系统性能测试通过自动化的测试
随着信息产业的蓬勃发展,软件所扮演的角色越来越重要。在软件产业的发展过程中“软件危机”逐渐暴露出来。研究发现,“软件危机”的实质是缺乏对软件项目进行过程管理。对于中小软件企业,由于自身人力资源匮乏且人员流动量大、资金少和制度的不完善等原因,实施软件质量管理存在更多的困难。本文在开发一个质量保证系统之前对程序的开发框架进行了研究,提出了一个在中小软件企业中普遍适用的开发框架。针对中小软件企业自身的特
对于很多网络应用,高效可靠的互联网性能参数测量对其是否能正常工作至关重要,尤其是与语音、视频传输相关的应用。由于互联网的异构性和复杂性,许多现有的网络测量方法尚不完善
程序挖掘是网络环境下实现按需定制服务的一种新型的网络计算模式。它的基本思想是:分析用户计算需求,从构件资源库中检索获取所需构件,并把这些构件组装成满足用户需求的程
Adhoc网络具有自组织、无中心、动态拓扑等特点,广泛应用于民用、军事、救灾等各个领域。现有的Adhoc安全路由协议,大多运用密码学手段对路由消息进行安全操作,提供路由消息