Hadoop平台运维关键技术研究与实现

被引量 : 6次 | 上传用户:olived0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着互联网的快速发展,特别是移动互联网的到来,上网的人群越来越多,随之而来的是产生大量的数据,而且这些数据是以指数形式的增长,要对这些数据进行存储与计算将变得非常的困难,所以Hadoop应运而生,通过Hadoop的HDFS(分布式文件系统)和MapReduce (分布式计算框架)能够帮助企业解决大数据的存储与计算问题。Hadoop作为一个开源的分布式框架,被很多公司所追捧,许多大公司的Hadoop集群的规模已经达到了几千台。对Hadoop集群进行有效的运维,可以大大提升工作的效率。本文主要对Hadoop平台运维中的几个关键的技术进行研究与实现,包括NameNode单点故障问题、对Hadoop集群进行监控、Hadoop平台中运行的Hive Sql任务进行调优。1、NameNode的单点故障问题:主要是通过SecondaryNameNode+NFS的方式来解决,SecondaryNameNode主要是进行日志文件和镜像文件的合并,NFS是通过一种远程的目录来对HDFS中的元数据进行备份。2、Hadoop集群的监控:是通过开发一个Hadoop集群的监控系统,该监控系统分为三个模块,包括Job监控模块、HDFS监控模块、节点监控模块。其中Job监控模块包括正在运行的Job及其进度,失败的Job和已完成的Job。HDFS监控模块主要是集群中HDFS的使用情况,包括集群总的HDFS的使用情况以及集群中每个节点的HDFS的使用情况。节点监控主要是Hadoop集群中每个节点的cpu,mem的变化情况。3、Hadoop集群中运行的Hive Sql任务进行调优:是通过分析Hive语句的特性以及该Hive语句使用的数据的特性,根据不同的情况,通过设置作用在map side或者reduce side的参数,从而对HiveSql任务进行调优。
其他文献
目前,普通高中普遍使用的生物教材内容清晰,条理清楚,适合于大多数高中学生的认知水平,教材中根据课程计划安排了许多实验设计,但是生物教材中所涉及的一些实验设计存在瑕疵,
随着人工冻结法正被多领域广泛地应用。对于通过人工冻结法形成的冻黏土的研究就成为了工程应用中不可缺少的一部分。本文正是考虑到人工冻结法在工程实际应用中的重要性,以
随着经济发展以及人们生活水平的提高,人均拥有小汽车的数量与日剧增。与其他城市一样,邢台市进一步合理确定居住区机动车停车位的配建标准,已经成为影响今后居民出行、交通
虽然到目前为止,我国还没有发生过重大的核辐射,核泄漏事件,核辐射水平在各个领域都保持的在基本的范围内,但是,不得不说核辐射仍然存在着一定的安全问题,所以就需要对核辐射
以216名大学生为被试,创设关系复杂性不断增高的三种学习材料,通过功能预测任务和维度选择任务,比较探查了不同学习程度下参照性交流和个人学习的差异特点。结果发现:(1)关系复
改造后脱硫装置的脱硫塔能满足10万吨合成氨生产能力需要,主要措施是单塔、双级脱硫。脱高硫时,更换下塔的填料。应尽快更换溶液分布器,扩大溶液管,更换扬程低、流量大的溶液
论文论述长江三角洲区域环境连续监测系统中针对水环境污染监测子系统的监测数据管理与分析系统。该系统是针对该区域的长期环境战略举措的一个重要组成部分,基于先进的信息
儿童大病的巨额医疗费用已经给一些家庭带来了沉重负担,而我国目前的儿童医疗保障体系现状是:只有商业保险一种医疗保险方式和几个大中城市建立了医疗互助制度。为此,针对建
聚乳酸发泡材料(PLA foams)是一种利用可生物降解聚乳酸为基体相,气体为分散而形成的具有特殊性能的材料。聚乳酸发泡材料以低密度、优异的阻隔性能和耐冲击性能,以及环保可
近几年建筑重点工程建设发展很快,工程建设不断规范和质量进一步提高,但监理市场还不够规范,监理单位的管理水平及监理人员的业务能力和综合素质与建筑建设的发展不相适应,因