基于Hadoop的能源数据存储体系中多级索引表DHT算法的研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:jematrix
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在21世纪的今天,能源问题成为了一个严重影响人们生产和生活的问题。目前的国内形势来看,进入21世纪以来电力持续短缺,煤炭资源全面紧张,天然气的价格也随着需求的扩大不断提高。与此同时,电力、天然气、煤炭资源等等资源的消耗与开发产生了极大的数据量,如果能够存储和管理好这些数据可以为能源的节约和高效利用提供一个有效的途径。能源数据在目前从数量上来说已经到了海量级。采用传统的关系数据库SQLSERVER、MYSQL、ORACLE等等虽然在目前仍然能够勉强满足存储的需求,但是需要一个超大容量的存储空间,扩展性存在瓶颈。另一方面传统的关系数据库在面对海量数据的数据查询请求时,查询效率较低越来越变得难以让人接受。  怎样解决在海量数据的背景下的存储和精确查找成为了当前的关键目标。目前来看云存储的技术对海量的能源数据进行存储和高效的管理是一种比较可行的方案。同时,高效准确地在云存储的环境下查找到需要的数据也成为了一个关键的问题,现有的查找算法虽然在一定程度上可以查找数据,但是目前仍然需要进一步的改进与性能提升。  本文首先介绍了当前的云存储环境下的查找算法的背景与国内外的发展水平,然后详细介绍了相关的技术和名词。根据能源数据的特性和 Hbase的表的特点,利用Hadoop平台,设计了一个依托Hadoop和Hbase的存储系统来存储和管理能源数据。成功实现了能源数据的分布式存储功能,然后对其模型做了进一步的改进。再在 Hbase的基础上进行了快速查找算法的研究,设计了一个多级索引表查找算法,通过MapReduce编程模型实现了算法的仿真。仿真实验的结果证明了该查找算法(*)DHT的查找效率在云存储的分布式环境下相比于传统的数据查找方法和现有的查找算法有了可观的性能提升。  基于Hadoop的能源数据存储体系及其多级索引表DHT算法的成功实现对于现有的传统方式而言具有重要的意义。Hadoop与其内含的Hbase系统能在普通的PC机上面模拟大型的云存储平台,当数量上达到一定程度后即是云存储平台,拥有十分高的可行性,这意味着该研究在将来成熟时有很高的现实意义和实际价值。
其他文献
随着计算机网络安全问题也不断增加,网络安全已逐渐发展成为人们关注的焦点。由于网络安全的综合性和立体性,单纯依靠网络安全技术不可能满足全部的安全要求,将其他学科的理论或
由于神经网络应用环境的复杂性及要求处理大量数据的问题,从而神经网络计算需要超强的计算能力,因此在神经网络计算平台中引入了网格和分布式的思想,力图建立一个基于网格的神经
随着Internet以及Web的发展,不论是电子商务还是电子政务,都逐步走向电子化的经营与管理。但随之而来的信息安全与管理问题就十分重要。 在管理大量的网络系统时,安全管理的
蛋白质折叠问题是当今生物信息学领域的核心问题之一.研究发现,蛋白质的生物学特性在很大程度上由其三维空间结构决定.人们从蛋白质折叠问题中总结出一些宜于求解的简化模型,
随着物流领域CRM产品的不断引进,面对大量堆积成山的数据,物流企业是否能够从中发掘出有用的信息为企业服务,成为企业生存发展的一个关键。 本文详细论述了数据挖掘技术及其
随着信息化的发展,电子政务的发展也越来越快。以电子政务为核心的政府信息化是推进我国国民经济信息化的关键,是一项系统工程,是国家信息化建设的重要领域。因此,标准化作为支撑
近年来,电子商务在国内外得到了广泛的应用,B2B电子商务更是得到了迅猛的发展。在新一轮的产业升级中,电子商务的发展为我国实现跨越式的发展提供了一个挈机,所以研究和开发B
论文介绍了机坪自动供油系统中的管线压力控制问题,针对供油管线中的时滞、干扰问题提出了应用专家思想的智能PID控制策略,在控制参数的寻优过程中创新性地应用数理统计的方法
借助于互联网和分布式计算技术,企业与企业之间可以完成业务的协作,这就是所谓的企业对企业(B2B)的电子商务(e-business)。在B2B的电子商务中,工作流管理系统(WfMS)起到了十分重
随着计算机科学的不断发展,大量的原始数据被不断收集并存储到计算机中,而数据处理能力的低下,造成了目前信息丰富,知识贫乏的现状。数据挖掘——用非平凡的方法从大量数据中发现