论文部分内容阅读
空间数据对象除了空间属性(比如位置)之外,还有一些非空间属性(比如对空间数据对象的描述信息)。但是,目前关于海量空间数据聚合查询的国内外研究还是主要局限在纯空间属性层面,因此重点研究一种空间属性和非空间属性结合的混合聚合查询:基于关键字匹配的海量空间数据聚合查询。 为了提升基于关键字匹配的海量空间数据聚合查询的效率,结合海量空间数据聚合查询和海量空间数据关键字查询的国内外研究概况,设计了一种新的索引:倒排聚合空间索引(Inverted Aggregated R-tree,下面简称为IAR-tree)。IAR-tree是基于R-tree的,但是不同的是:叶子结点中有空间数据对象的描述信息和关键字之间的倒排索引;中间结点中有关键字对应的聚合信息。因此,只需要查询IAR-tree,就可以完成基于关键字匹配的海量空间数据聚合查询。 首先对IAR-tree从索引设计目标、定义、结构介绍等三个方面进行了详细介绍,并且使用MapReduce框架给出了索引的并行构建算法,描述了使用IAR-tree做聚合查询的操作和索引的更新(插入和删除)操作。然后给出了索引IAR-tree基于HBase平台的实现,主要包括空间数据对象和IAR-tree的存储、几个主要数据结构的说明和查询、插入、删除这几个主要操作的详细实现算法。通过对算法做性能分析,证明了IAR-tree不仅查询效率比较高,更新代价也比较低。 最后,通过对海量空间数据做IAR-tree并行构建测试,表明提出的IAR-tree并行构建算法提升了索引的构建速度;通过对IAR-tree做与R-tree的对比测试,表明IAR-tree在海量空间数据的聚合查询上有比较明显的性能提升,而且索引的更新效率跟R-tree差不多。