论文部分内容阅读
近年来,从大型数据库中(包括GIS数据库)发掘有价值的、潜在的信息变得越来越重要,同时社会对各种信息的需求也急剧增加。但是却出现“数据巨大、知识贫乏”的局面,知识发现理论KDD(Knowledge Discovery based on Database)的提出,为解决这个问题提供了新的契机,使得从大量复杂的数据中获取蕴含在其中的信息与知识成为可能,而数据挖掘(Data Mining)正是KDD的核心。另一方面,在现有的GIS中,属性数据主要应用在检索或查询、或进行简单的统计,难以进行深入的分析,难以挖掘其中隐含的模式和规律。空间决策支持系统的现状不理想正是因为缺乏大量有价值的信息、知识去支持。因此,本文主要探讨数据挖掘在GIS属性数据方面的应用,旨在辅助空间决策支持。本文的主要工作包括:1、空间数据管理与空间数据挖掘步骤;2、论述GIS的空间查询语句挖掘数据表中的隐含信息的不足,提出数据挖掘的必要性,并对源数据作了预处理;3、单维表的处理:◆应用Rough集理论对数据进行分析处理。对Rough集理论算法思想进行了论述,并编程实现了对GIS属性数据的处理;◆讨论关联规则,指出了Apriori算法的不足,在原算法的基础上改进了算法;与原算法对比,advanced_Apriori算法在算法复杂度(空间复杂度与时间复杂度)上具有很大的优越性;◆给出这三种方法(Rough集理论、Apriori算法、advanced_Apriori算法)在算法复杂度(时间复杂度和空间复杂度)的比较,并对优劣进行评定;4、多维表的处理:提出空间数据挖掘模型,采用SQL Server建立星形数据模式,以此建立空间数据立方体,采用DB Miner进行数据挖掘;5、最后是本文的结论和展望;对前面各章的总结,得出几点结论,并指出需要进一步探讨的问题。