大数据环境下油气钻井信息分布式数据仓库系统研究

来源 :西安石油大学 | 被引量 : 0次 | 上传用户:shiguanghuai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
钻井智能化是未来发展的必然趋势,油气钻井数据正以前所未有的速度增长,加上油气信息分布广泛的特点,如何对海量数据进行存储和利用是油气钻井作业中亟需解决的问题。比如对海量异构数据的存储和抽取转换方式,分布式存储的数据同步方法,处理海量数据的运算方式等。本文提出了一种基于Hadoop的油气信息分布式数据仓库模型,为解决以上问题提供了一个指导方案,所做工作有以下四个方面:首先,提出大数据环境下油气信息分布式数据仓库模型。基于油气信息的特点,结合Hadoop理论知识,提出通过HDFS实现海量油气钻井信息的存储,Hive数据仓库实现数据的大规模并行查询,MapReduce实现数据的大规模并行运算,HBase提供信息的实时服务,运用Sqoop技术与关系数据库进行信息交互。其次,对基于Hadoop的油气信息分布式数据仓库的设计。包括数据仓库主题及主题域的设计,事实表和维表的设计,数据模型的设计和数据粒度的设计,并且对数据抽取、转换和装载的过程进行论述。然后,针对海量油气钻井信息的特性对各个部分进行了优化,包括HDFS存储的优化,MapReduce运算的优化,基于Hive的油气钻井信息分布式数据仓库数据查询的优化和HBase存储的优化。最后,设计并实现了基于Hadoop的油气钻井信息分布式数据仓库系统,搭建一个Hadoop集群并且对钻井数据进行分布式存储和分析,并且设置传统方式的数据仓库作为对比组,分别对不同数据量的钻井数据进行查询运算,通过控制变量数据量的大小与运算时间绘制折线图,得出结论。
其他文献
通过金相分析及断口观察 ,对GCr15钢轴承套圈的磨削开裂进行了系统分析。结果表明 ,淬火裂纹是套圈失效的根本原因 ,而原材料中Cr的带状偏析、套圈表面的应力集中、淬火加热
目的 探讨血浆TC/HDL-C比值预测冠心病严重程度的价值。方法 选择驻济干休所2013-05—2015-05因胸痛、心前区不适行冠脉造影术的患者250例。按照诊断结果分为非冠心病组71例,
通过对节能建筑中室内舒适度影响因素的分析,提出了改善室内舒适度的有效方法,对促进舒适性节能建筑的发展具有重要意义。
本文详细论述了试验箱温湿度校准装置的研制。本项目的研究目的是解决目前在用的大量温湿度试验箱的校准和测试问题。 本项目是根据试验箱温湿度校准及计量测试要求,以国
入世标志着中国对外贸易进入了新时期。2004年中国对外贸易额达到1.15亿美元,成为世界第三大贸易国,但中国经济发展要求中国对外贸易进一步发展,并要求与之相适应的外贸政策
稀土具有丰富而独特的磁、光、电等性质,广泛应用于高新技术及国防尖端技术等领域。随着稀土资源的不断消耗,从二次稀土资源(FCC胶渣)及伴生稀土资源(磷矿)中提取稀土逐渐引起广
随着信息技术和通讯技术的迅速发展,异地异时的分布式群体决策已经成为新的趋势。分布式群体决策过程实际上是一种群体交互与协作的过程,这不是一般意义上的合作,而是快速、
她,娇小的个子,扎着花苞头,身穿电力工作服,声音清脆而响亮……她叫高洁玲,在电力行业工作已有20余年,2014年1月为适应国家电网公司深化“三集五大”体系建设的要求,通过竞聘
当前人类社会整体正在经历重大的历史性时代转型。迄今为止的人类社会中的一切治理形态,都是以金字塔型为核心结构。然而,社会信息网络的不断发展,使得社会中原先封闭的金字