基于关键字匹配的海量空间数据聚合查询索引研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:alexander_guwen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
空间数据对象除了空间属性(比如位置)之外,还有一些非空间属性(比如对空间数据对象的描述信息)。但是,目前关于海量空间数据聚合查询的国内外研究还是主要局限在纯空间属性层面,因此重点研究一种空间属性和非空间属性结合的混合聚合查询:基于关键字匹配的海量空间数据聚合查询。  为了提升基于关键字匹配的海量空间数据聚合查询的效率,结合海量空间数据聚合查询和海量空间数据关键字查询的国内外研究概况,设计了一种新的索引:倒排聚合空间索引(Inverted Aggregated R-tree,下面简称为IAR-tree)。IAR-tree是基于R-tree的,但是不同的是:叶子结点中有空间数据对象的描述信息和关键字之间的倒排索引;中间结点中有关键字对应的聚合信息。因此,只需要查询IAR-tree,就可以完成基于关键字匹配的海量空间数据聚合查询。  首先对IAR-tree从索引设计目标、定义、结构介绍等三个方面进行了详细介绍,并且使用MapReduce框架给出了索引的并行构建算法,描述了使用IAR-tree做聚合查询的操作和索引的更新(插入和删除)操作。然后给出了索引IAR-tree基于HBase平台的实现,主要包括空间数据对象和IAR-tree的存储、几个主要数据结构的说明和查询、插入、删除这几个主要操作的详细实现算法。通过对算法做性能分析,证明了IAR-tree不仅查询效率比较高,更新代价也比较低。  最后,通过对海量空间数据做IAR-tree并行构建测试,表明提出的IAR-tree并行构建算法提升了索引的构建速度;通过对IAR-tree做与R-tree的对比测试,表明IAR-tree在海量空间数据的聚合查询上有比较明显的性能提升,而且索引的更新效率跟R-tree差不多。
其他文献
客户/服务器计算模型(Client/Server: C/S)是现代互联网应用的核心。结构的简练和高效使其成为Internet的主流,现有应用也多以此为基础。但随着网络应用规模的快速扩展,该模
本文在论述需求工程及需求管理的相关理论和技术方法的基础上,指出有效的需求管理措施是软件项目取得成功的关键。由于目前国内软件行业中,人们对于需求管理的认识尚不够充分
20世纪90年代后期,新型商务和通信的不断创建对软件开发提出了更高的要求。在分析中发现,传统的软件设计、开发方法在设计和开发较大型的软件时显露出开发周期长和成本高的缺
Web站点日志的数据挖掘是对用户与Web服务器的交互产生的日志数据使用数据挖掘技术发现隐含的规律性知识,得到用户的访问模式和用户的兴趣,从而为用户的个性化服务提供依据,
自然场景下的文字识别由于文字所处背景复杂,很难准确定位到图像或视频中的字符,字符的定位技术成为解决自然场景下文字识别的重要环节。以自然场景图像中的文字定位与提取作为
网络地理信息系统(WebGIS)是测绘技术与计算机应用技术相结合的产物,使地理信息系统依托计算机网络真真实现了信息共享,并由此衍生出面向社会各行各业的应用,成为当前计算机
在计算机动画模拟领域中,对水动画的模拟是一项困难而又有意义的课题。本文中使用了两种方法对水动画进行模拟。一种是利用求解浅水波方程常用的数值方法,另一种是通过粒子系统
本文对基于GPS&GPRS的车载监控终端硬件设计进行了研究。文章介绍了采用ARM7核的LPC2104的特性;ubloxGPS信号接收机的基本结构、主要功能、接口定义;GPRS模块的开发,针对wavecom
医学数字成像和通信(Digital Imaging and Communication in Medicine,DICOM)是医学图像及有关信息统一格式及交换方法的标准。论文基于对DICOM标准中相关理论的研究,阐述了