论文部分内容阅读
自80年代中期以来,数据库中涉及数据分布性、多样性、数据共享和数据理解等问题被广泛研究;许多先进的数据模型被广泛利用,如扩展关系模型、面向对象模型、对象——关系模型、演绎模型;产生了许多面向应用的数据库系统,如空间数据库、时态数据库、多媒体数据库、科学数据库、知识库、办公室信息库、异质数据库和全球信息库(Internet)等等。
目前,在空间数据挖掘系统的开发方面,国际上有代表性的通用SDM系统有:GeoMiner Descartes和ArcView GIS的S_PLus接口。加拿大Simon Fraser大学计算机科学系的数据挖掘研究小组,在MapInfo工作平台上建立了空间数据挖掘的原型系统(GeoMiner,实现了空间数据特征描述、空间区分、空间关联、空间聚类和空间分类等空间数据挖掘方法。)ArcView GIS的S_PLus接口是著名的ESRJ公司开发的,它提供工具分析空间数据中指定的类。美国在2003年实现的空间信息处理项目EOS(Earth Overview System),对全球地面监测的精度将达到1米的分辨率,该项目对巩固美国在全球的竞争优势具有重要的作用,该项目的主要组成部分之一就是空间数据的联机分析与挖掘技术的研究。
在国内,目前已经开展空间数据挖掘的单位主要有:武汉大学、中科院地理所资源与环境信息系统国家重点实验室、中科院遥感所、中科院软件所、中国测绘科学研究院等。中科院己经开始创新项目“空间数据挖掘及知识发现”课题的研究。视觉与听觉信息处理国家重点实验室开放课题基金项目“空间数据联机分析与空间数据挖掘研究”,该项目重点对空间数据联机分析与空间数据挖掘及底层的空间数据仓库技术作基础理论研究。
新一代大型GIS产品MAPGIS7.1是武汉中地数码科技有限公司开发的面向网络海量空间信息的大型GIS基础软件平台。它采用全关系型数据库管理方案,采用面向对象的设计思想,实现了概念上的统一。空间统计分析器是其中的一个重要模块。
本文设计并实现了的空间统计分析的算法,结合MAPGIS7.1软件的空间数据模型设计,从多元统计分析和空间统计分析两个层次对其数据进行处理。多元统计分析用在分析空间地理实体的属性数据,基本实现数据预测和筛选功能;空间离散点统计分析用在探索空间点状实体数据位置关系隐含的规律。最后均用图谱和报表输出分析的结果。论文的主要工作与创新点如下:
首先,论文阐述了空间数据挖掘发展背景和主要特征,提出了本课题的重要研究意义和主要研究内容。
其次,详细阐述了空间数据挖掘的基础理论与技术框架,目的在于从宏观上把握空间数据挖掘的一般方法和研究途径及应用范围。
第三,对空间统计算法的原理和设计进行了详细说明,着重阐述了聚类分析、回归分析和KMEANS算法、DBSCAN算法。
第四,实现了空间统计分析算法的调用,即用户界面——空间统计分析器设计与实现。并通过几个案例说明了其实现过程,并将分析结果以图形显示给用户。
最后,针对系统功能不完善、效率有待进一步提高等问题,作者提出了改进的设想,并对空间空间统计分析的未来的发展做出了展望。
综上所述,本论文设计并实现的空间统计分析器。实现了结构复杂、数据量庞大的空间数据的统计分析,使GIS的理论研究在实际中得到了应用,具有很强的现实意义。