基于HBase的时空索引模型与检索方法研究

来源 :武汉理工大学 | 被引量 : 1次 | 上传用户:pollyzhang15
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时空数据是一种同时具备时间属性、空间属性以及其他属性的多维数据。随着无线通信、移动定位以及传感器的广泛应用和发展,时空数据无论从种类、增长速度还是数据规模上都迎来爆发式增长。传统的关系数据库系统由于存储容量﹑可扩展性等方面的限制,已经难以满足海量时空数据存储和管理的需要。HBase作为非关系型数据库的代表,可扩展性强,为时空数据存储和管理提供了新的途径。目前,基于HBase的时空索引和检索技术还存在不足之处,一方面,树形结构的时空索引结构复杂而且无法对并发处理提供足够的支持;另一方面,特定结构的索引能够支持的查询种类单一,可扩展性不足。本文在分析HBase和时空数据特点的基础上,以Hilbert curve空间填充曲线、HBase二级索引技术和MapReduce并行计算框架为理论基础,对基于HBase的时空索引模型与检索方法进行了深入研究。本文的主要工作如下:(1)设计了基于HBase的时空数据存储结构:良好的存储结构有利于提高系统的吞吐量,同时也为索引的设计提供便利。本文分别从行键和列族两个方面讨论了基于HBase的时空数据存储结构的设计思路,并对其进行了简要的性能分析。(2)提出了基于HBase的时空索引模型:本文利用HBase行键按照字典排序的特性,结合Hilbert curve空间填充技术以及时间编码算法,在行键上设计了时空索引;考虑到应用需求的经常变更以及时空数据多属性的挖掘,在扩展列族上设计了Region级别的二级索引。本文设计的时空索引更加符合云计算环境的需要;另外,本文设计的二级索引相比于其他二级索引技术,在数据一致性以及可扩展性方面性能更优。(3)设计了基于HBase的时空查询算法:索引的设计是为查询服务的,而查询的设计必须考虑具体的索引结构。本文设计了时空查询并行化框架,并在此基础上结合时空索引模型,设计了并行化的时空查询算法。(4)设计并开发了一个原型系统,对时空索引创建的时空开销以及时空查询算法的性能进行了评估。实验表明,本文提出的基于HBase的时空索引模型和检索方法是行之有效的。
其他文献
车辆尾气是我国空气污染的主要源头,已对人们生活出行及身体健康造成严重影响。自2019年7月起,为了进一步提高全国环境质量,更好的发展绿色智慧交通理念,各地逐步开始实施国六排放标准,这就对排气检测方式提出更加严格的要求。目前,传统车辆排放检测方式存在设备体积庞大、成本高、工作过程繁琐、检测频次低和检测时间长等问题。在过去几年中,传感器技术在应用科学的不同领域研究中得到了广泛的应用。因其具有良好的敏感
目的:目前咽喉清复方治疗咽炎的机制仍不清楚,本研究基于急性咽炎大鼠模型,探讨咽喉清复方对咽部组织炎症细胞因子和炎症信号通路的调控情况,从而完善咽喉清复方治疗急性咽炎的作用机制,为临床治疗用药提供理论依据。方法:(1)48只SPF级SD大鼠(180-220 g)随机分为四组:正常组(Normal Control组,NC组)、急性咽炎模型组(Acute pharyngitis组,AP组)、咽喉清复方治
随着新媒体艺术的不断发展,互动影像以它具有的公开化、个性化、互动化、游戏化、情感化、成为了一种更受大众推崇的艺术体验模式。在互动影像设计作品中,影像的创作者已不再是扮演艺术文化的输出者,而是逐步放权给观众,观众已不再是被动的接受信息,而是更多的参与到影像作品的互动体验中,与创作者共同完成影像作品的艺术文化展现。怎样更好的参与到艺术作品的体验中,与艺术作品发生艺术文化的情感交流,将互动影像设计应用到
目前,我国的金融资产管理公司在处置不良资产中,面临着法律、市场、道德风险及人才等方面的制约,本文对此进行了分析,并提出完善法律法规、强化约束机制、提高员工素质及拓展业务
目前,全国中小学正积极进行教育改革,对于如今的学生而言,重要的是学会学习,因此教师不能只关注“教什么”和“怎么教”的问题,更应重视学生“学什么”和“如何学”的问题,这
【目的】哺乳动物体内摄入过多的热量会以白色脂肪的形式存储起来。过多的能量摄入是引起肥胖最主要的原因,肥胖是目前国际上最多发的代谢性疾病之一,由肥胖引起的II型糖尿病
新形势下基层人民银行加强和完善内部控制,严格金融监管,努力提高金融服务水平,减缓入世对我国金融业冲击和确保金融平稳运行,具有十分重要的意义.