基于HBase数据管理平台的设计和实现

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户:taotao_xr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,各种数据呈井喷式增长。这大大丰富了用户可用数据的渠道,但也使得海量数据的管理更加复杂,需要设计新的系统来应对数据管理的挑战。本文对主流以HBase为基础的数据管理平台进行了深入的调研和分析,发现以HBase为基础的数据管理平台存在使用原生API编程存储数据学习难度高且编程复杂,处理数据的自动化程度不足、检索数据效率低、数据易用性不足问题。基于上述问题,针对大数据场景,本文设计了一个新型的系统架构来解决其他基于HBase系统数据管理平台在数据管理上的数据收集、数据处理自动化、检索数据、易用性方面的问题。主要研究内容如下:第一,设计并实现了基于HBase的存储中间件,改良了数据存储的方式,设计并实现以面向对象的方式存储数据和自动构建索引的功能,提升了数据收集和存储效率。第二,设计并实现了 HBase的SQL编程接口和可视化界面,通过设计了 SQL解析模块和SQL-ES语法转换算法实现了更加灵活的SQL语法,通过设计WEB服务使HBase拥有缓存能力,提升了处理数据的自动化、检索数据的效率和易用性。本文搭建了基于HBase的数据管理平台—extendNoSQL平台并进行了性能测试。和原生API的效率相当,简化了编程难度,提升了数据检索效率和计算效率。综上得出能够本文系统在在数据管理即数据的收集、存储、处理和应用功能上更加高效和易用。
其他文献
六朝文学的绮丽是在人的觉醒和文的自觉后所必然要出现的一种符合文学发展规律的正常现象 ,是六朝人审美意识的艺术体现。文学创作主体与接受对象的统一是绮丽文学之所以产生
随着经济社会的发展和人民精神需求的提高,旅游越来越受到人们的关注,中国也因此迈入全民旅游的新时代。旅游活动对旅游地的经济发展、社会保障和环境变化等民生效应均有不同
目的:分析青年缺血性脑卒中患者脑动脉狭窄的发生率、血管分布情况、相关危险因素及病因学分型。方法:回顾性分析了西南医科大学附属医院神经内科2009年1月~2014年12月期间收
采用面层加浆变态混凝土做防渗体的全碾压坝,其变态混凝土性能的优劣,决定了该类结构能否具有理想的抗裂防渗效能。通过掺加HUEA膨胀剂并优化浆材配合比设计,可制取低干缩变
简要介绍了国内电动助力车和电动助力车用铅酸动力电池的发展情况、铅酸动力电池的最新发展技术以及电动助力车用铅蓄电池的慢脉冲快速充电技术。
从解剖王庄煤矿4318综放工作面采空区入手,利用现场实测和计算机CAD辅助计算的方法,首次在我国对缓倾斜综放工作面的回采损失进行量化分析,得出了顶煤损失在采空区的三维分布形态和量化