论文部分内容阅读
由于地理信息技术及其应用的普及和发展,空间数据出现了爆炸性增长。作为存储、处理和显示空间数据的主要工具,地理信息系统(GeographicalInformationSystem,GIS)开始与空间数据库(SpatialDatabase,SDB)技术相结合,使空间数据得到了有效的管理。随着空间应用的不断深入,人们不再仅仅满足于空间数据的查询管理,他们需要更为灵活高效的分析手段来处理这些数据,为决策分析提供支持。数据仓库作为一种决策支持技术,已经很好地应用于企业和部门的数据分析处理。近年来,人们开始将数据仓库技术应用于空间领域,并与GIS结合,来更好地支持空间决策分析。
空间数据仓库技术融合了GIS、数据仓库、空间数据库等多种技术。与传统数据仓库相比,空间数据仓库的构造难度更大,主要面临着两个挑战:(1)空间数据格式种类繁多,数据集成的难度较大;(2)空间数据立方体的构造将更加复杂。解决好这两个问题是构造空间数据仓库的关键。
本文在对现有研究成果进行分析和总结的基础上,设计并实现了基于SISP系统的空间数据仓库原型系统。本文的主要工作集中在对空间数据立方体的构造方面的研究,而多源空间数据的集成主要由SISP系统完成。本文的研究内容和成果主要包括以下几点:
1.研究空间数据仓库的数据模型——空间数据立方体。空间数据立方体是对传统数据立方体进行空间扩展得到的,它的度量和维都能够支持空间与非空间类型的数据。本文采用了三种策略来计算空间几何度量,分别是:指针集合策略、近似计算策略以及有选择地物化策略,较好地解决了由于空间几何度量计算复杂和需要较大存储空间带来的困难。此外,还提出了空间属性在度量和维角色之间进行转换的思想,这样可以通过其它维的概念层次来构造出丰富的空间维概念层次,克服了空间维缺乏概念层次的问题,提高了空间OLAP分析的能力。
2.研究空间数据立方体的物化策略以及计算方法。为支持高效的空间OLAP分析操作,本文提出了对空间数据立方体进行有选择地物化的策略以及在此基础上的方体计算方法。与传统数据立方体物化时一般只进行方体层次的选择不同,空间数据立方体的物化选择分两个层次进行:方体层次和单元格层次。方体层次的选择决定哪些方体应该被物化,而单元格层次则决定这些方体中的哪些单元格所包含的空间几何度量该被物化。本文给出了物化选择和计算查询方体所使用的代价模型以及相关算法,它们是构造空间数据立方体的关键。
3.设计并实现一个简单的空间数据仓库原型系统。原型系统是以SISP提供的空间数据库为基础,并结合全球气候数据集CRUTS2.0来进行设计。该数据集包含了从1901年至2000年1200个月份的气候信息,经纬度每0.5度一个采样点,共有7000多万条记录,包括平均气温、降雨量、气压等5种属性。原型系统采用了上述的空间数据立方体模型和构造技术对气候数据进行组织,在有选择地物化的基础上,系统提供了简单、灵活的数据访问接口,可以方便地实现各种空间OLAP分析查询,具有较高的可扩展性。原型系统还提供了简便的可视化操作界面和地图方式的结果展现。
本文的研究得到国家自然科学基金项目和国家高技术研究发展计划(863计划)课题《新一代GIS关键技术研究》的支持,并在空间信息分析和挖掘中得到初步应用。