云环境下MapReduce多组容错机制的研究

来源 :河南理工大学 | 被引量 : 0次 | 上传用户:maomao147
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展与普及,人类社会已由信息时代进入了大数据时代,传统的计算模式已经不能满足时代的要求,一种新兴的商业计算模型——云计算应运而生,云计算为计算机行业带来了新的机遇和挑战。云计算是一个大规模的分布式计算系统,为互联网上的外部用户提供抽象的、虚拟的、动态调整以及可管理的计算能力、存储、平台以及服务。云计算最典型的案例是Goolge公司提出的MapReduce并行编程模型,它简单易用、并行化程度高、可靠性高等特点吸引了很多用户。目前,国内外针对MapReduce编程模型各个方面的研究很多,其中关于MapReduce容错机制一直是研究热点之一。针对容错机制的研究可以总结为两种方案:备份和再执行,但是这两种方案有一个基本前提条件——感知到失效节点,如果感知失效情况不及时或者不准确,这两种方案也就不能发挥作用了。本文将从一个新的视角出发,针对如何更快更准确的发现失效节点问题展开研究,主要分为以下几个方面:首先,根据需求分析设计容错方案,简单地将其分为三个步骤:多组监测、请求申请、任务迁移,分析各自的职能,研究多组容错的运行机制。其二,对传统的MapReduce架构进行改进,在同机柜中的各个TaskTracker节点之间搭建多组架构,建立多组心跳机制,分别在TaskTracker和JobTracker上增加多组类multipleTaskTracker、multipleJobTracker,实现多组容错。其三,对任务迁移过程中可能出现的资源竞争问题进行补充,根据公平性原则,针对两类资源竞争现象按照各自的规则进行任务迁移。最后,分别从响应时间、加速比和多组容错的优势三个方面对多组容错性能进行分析,得出在不影响系统扩展性的前提下,多组关系提高了监测失效节点的效率,节约了作业响应时间,降低了带宽使用率,减少网络拥塞,减轻了JobTracker节点的负荷。大量实验数据表明,在不影响MapReduce系统可扩展性的前提下,多组容错要明显优于传统容错方案。在集群中存在失效节点时,多组容错可以将发现失效的时间大幅度地缩短,并且可以游刃有余的解决任务迁移过程中的资源竞争现象。
其他文献
近年来,软件复用在软件产业界的地位已经日益重要,它被视为解决软件危机、提高软件的生产效率与质量的现实可行的途径,而各种新技术的发展为软件复用带来新的市场和需求,特别
  在Web环境下,中文信息处理对象由少量、规范的例句扩大到大规模、非规范的文本;中文信息处理范围由单个典型的领域扩大到多个开放的领域,这样,词典对分词精度的影响更加突出,
锅炉管壁超温现象是当前火力发电厂普遍存在的问题,被列为电力生产严防的二十五项重大事故之一,它的存在严重影响着锅炉的安全性、可靠性及企业经济效益。通过分析,产生锅炉管壁
与IPv4 相比,IPv6 作为下一代互联网的基础协议,具有很多优势,首先,IPv6解决了IP 地址数量短缺的问题;其次,IPv6 对IPv4 协议中诸多不完善之处进行了较大的改进,其中最为显著
  随着互联网的普及,如何在电子虚拟世界中吸引新的客户,并留住已有客户成为许多电子商务系统的首要任务。推荐系统向用户提供商品信息和建议,模拟商店销售人员向客户推荐商品
随着互联网技术和分布式计算技术的迅猛发展,被业界称为计算机IT技术第三次革命的Web Services技术已逐步显露出巨大商机,软件业正面临着一次最大规模的“洗牌”。Web Servic
从卫星传回的遥感图像上获取卫星遥感器的关键评价指标MTF的变化情况,是目前国际上一个非常活跃的研究课题,对于在轨运行的卫星遥感器的监测和寿命预估,以及后继卫星的研制,有着非常重要的意义。目前,国内在这方面的研究尚处在起步阶段。因此,在本文中将着重介绍如何从卫星遥感图像获取在轨卫星MTF的基本方法及在MTF测评研究中的一些创新应用,其中如何从卫星遥感图像获取在轨卫星MTF的基本方法主要是在借鉴美国N
作为数字产品知识产权保护的一种有效手段,数字水印技术得到了广泛关注,并已成为国际学术界的一个研究热点。本文通过对数字水印技术尤其是认证型水印技术的系统研究,给出了
实时数据库是数据和事务都有定时性限制的一类特殊数据库,主要针对各种时间关键型应用。过程控制是实时数据库一个非常重要的应用场合,它主要处理生产装置、生产过程的控制和
基于Internet的在线视频业务的开发是近年来非常热门的研究内容。在有限带宽的条件下如何实现音频、视频传输的流媒体技术日趋成熟,提供在线VOD服务亦成为某些商业机构的营利