基于MapReduce的分布式空间连接查询研究

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:liongliong570
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着信息化步伐的加快,地理空间信息获取技术进步日新月异。同时,地理空间数据规模与日俱增,已成为海量数据的重要来源之一。空间连接查询是一种常用且非常耗时的复杂空间查询操作,特别是在处理大规模空间数据集时,由于传统单机系统和MPI集群系统都难以满足其对时空开销的需求,因此,如何在云计算环境中设计高效的分布式空间连接查询算法已成为当前学术界和产业界研究的热点问题。本文首次尝试提出了一种云计算环境下的分布式QR-树索引结构,并在该索引基础上进行基于MapReduce的空间连接查询。本文主要工作如下:(1)提出了一种云计算环境下能够支持大规模数据集的分布式QR-树索引结构,并详细介绍了其构建的过程。分布式QR-树索引的构建过程可分为以下两个步骤:首先,采用基于四叉树的空间数据划分对空间数据集进行划分并分布式存储在HDFS数据块中;然后,在分割后的每个子区域数据块中并行构建R树索引。(2)在构建分布式QR-树索引基础上,将分布式QR-树索引结构与分布式并行计算框架MapReduce相结合,设计和实现了基于MapReduce的空间连接查询算法QRSJ-MR。另外,针对算法中存在的索引并发访问问题,采用了实时缓存机制对索引并发访问进行优化。(3)搭建Hadoop集群环境,测试基于MapReduce的分布式空间连接算法QRSJ-MR的效率。本文在空间交叠连接查询和空间包含连接查询上,分别与非索引的MapReduce空间连接算法和基于R-树索引的MapReduce空间连接算法做了性能对比实验。实验结果表明:与非索引的MapReduce空间连接算法和基于R-树索引的MapReduce空间连接查询算法相比,无论在空间交叠连接查询还是在空间包含连接查询上,QRSJ-MR算法都具有更高的执行效率。
其他文献
对于高校学生思政培养工作具体开展来说,完善文化素材融入,创新文化理念,其必然能够在实现高校学生培养理想效果的基础上,实现整个教学活动的创新与完善.本文拟从当前高校学
免疫胶体金技术是一种快速、简便、结果容易判定的新型免疫标记技术,应用免疫胶体金技术制备试纸条具有特异性强、价格低、灵敏度高的特点,适用于马铃薯病毒检测,特别广泛适
微信、微博等网络交流软件的出现,引领了微媒体时代的到来,对当代人沟通交流与信息获取等产生了深远影响。社会逐渐进入“互联网+”时代。在“互联网+”的背景下,中国高校美术教
通过简单介绍本溪动物园的基本情况,就本溪动物园药用“百草园”开发利用的可行性进行了较为详细的分析,并对开发利用的成效、成功经验及存在的问题做了初步探讨。
在城市高速发展过程中,人们越来越重视城市景观的文化内涵;地域特色和文化特色成为景观设计的指向标,因此,城市区域性公园作为城市景观的重要组成部分,也成为民俗文化的主要
城市公园服务设施是为游人休闲活动提供基本服务的公共设施。选择南京市公园服务设施为研究对象,通过实地考察、访谈以及问卷调查,找出目前城市公园服务设施存在的问题,并探
高校思想政治理论课属于当下意识形态类公共课程,是大学生置于升学与就业方向的先导。中国传统的茶文化可以通过其内在的物质和精神特质渗透到高校思政课素材当中,依据茶文化
为提高决选玉米自交系的效率,加快玉米单倍体诱导育种的研究进程,对玉米单倍体诱导育种的发展历程、研究进展及应用现状进行综述,展望了单倍体诱导系在玉米育种中的应用前景。
金属矿山的电气节能是一项系统性的工作,金属矿山的电气节能措施对于提升矿山运营安全性和减少资源浪费都有着重要的意义。文章对金属矿山电气节能的内容进行分析后,对于金属
矿业经济形势进入"低收益、高风险"的新常态,目前我国铁矿企业的发展步履维艰。铁矿企业采选工序能源消耗巨大,节能降耗是降低矿山生产成本,提高企业生存能力和市场竞争力的