基于数据压缩比的Hadoop Mapreduce资源管理策略

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:qq3264132
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Mapreduce计算框架在Hadoop平台上现有的资源管理模式存在着诸多问题,在hadoop平台被各行业广泛应用和不断改进的过程中这些问题逐渐凸显。在实际生产环境中,Hadoop YARN(Yet Anouther Resource Negotiator)现有的资源调度管理机制存在的问题逐渐凸显。一方面,现有资源管理机制没有将集群的负载多样性和节点计算能力差异纳入考量,为不同节点上的不同负载任务分配相同的定额资源,造成资源的浪费;另一方面,YARN中用于封装资源的资源容器设计不合理使集群用户很难合理使用容器。针对Hadoop集群资源管理中存在的这些问题,提出了一种基于数据压缩比的MapReduce资源管理策略,该资源管理策略以数据压缩比作为负载的基本特征,收集集群运行中产生的负载历史信息,利用机器学习模型来预测和分析负载特征,使用任务级的资源调度器为不同特性的负载选择相应的任务级资源调度策略;提升资源利用率的同时,优化了负载的时间性能。同时引入了弹性容器的概念,利用对集群节点性能的监控和评估,控制相应节点上的并发度,避免部分节点出现性能瓶颈。此外对容器的资源监控作出优化,允许资源容器偶发式的超量资源使用,避免了严格监控带来的负载重复执行和资源浪费。使用bigdata benchmark的多种测试样例开展多项性能测试,结果表明部署了该资源管理策略和弹性容器后的Hadoop系统能够有效增加节点的任务并发度、减少磁盘I/O请求,对负载的时间性能有明显的提升,同时减少了集群资源的浪费。在Hadoop 2.7平台上的测试结果显示,所提出的资源管理策略可以使作业的响应时间性能提升15%到40%,集群资源利用率提高了167%的同时节点的任务并发度是原生Hadoop集群的2到3倍。
其他文献
有机磷化合物有着独特的性质和广泛的应用,因此开发更加简洁和绿色的合成方法一直在不断的探索中。脱氢交叉偶联和借氢还原反应是目前合成有机磷化合物最高效的方法。本文主
利用天文周期方法研究地层剖面的完整性问题在地学研究历史中当属首例,其相比较于前人提出的潜穴化石定性估测法、古地磁法、研究剖面的厚度与同时期全球平均沉积厚度的比值、地层剖面长期沉积速率与短期沉积速率的比值法等方法拥有精度高计算方便等优点。本文主要利用东濮凹陷上古生界地层进行研究,通过频谱分析、小波变换等技术方法对与沉积环境变化密切相关的自然伽马测井曲线进行分析,开展对该段地层沉积相分析、沉积时限、沉
中国城镇化进程的加速、医疗改革的不断推进,给中国的医疗行业带来了许多新的机遇。医用胶片也随着医学影像诊断的不断发展,在中国市场迅速扩展,成为近十年最有发展潜力行业,
图处理系统被广泛应用于在线社交网络、社区发现等诸多应用领域,随着图数据集规模的不断增大,图算法的执行时间越来越长,多任务场景也越来越普遍。当前的外存模式图处理系统
本研究首次成功制备出新型三维粒子电极光催化剂Ag-TiO2-MCM-41,并将其应用于光电催化降解有机物领域,对于净化水环境具有重要意义。利用水解法结合银镜法制备Ag-TiO2-MCM-41
滚动轴承作为旋转机械的关键部件,其健康状况对安全生产至关重要。工业生产过程中,可靠的轴承故障诊断和寿命预测技术可以提供充足时间来修复或更换旋转机械设备当中有缺陷的轴承部件,进而降低维护成本、缩短停机时间。目前在大数据和人工智能备受青睐的工业背景下,基于深度学习技术的滚动轴承智能诊断和寿命预测方法越来越受到广泛关注。然而,至少还存在以下问题制约着智能方法的应用:故障数据通常难以获得导致神经网络的训练
随着移动互联网技术、智能终端和社交媒体等技术的高速发展,数据规模呈现爆炸式增长,大规模数据给处理和计算提出了非常大的挑战。基于外存的图计算系统能够利用低廉的硬件资
本文以阜阳方言中常用的程度副词为研究对象,通过真实语料的调查,结合前人关于阜阳方言程度副词的研究成果,选取几个具有代表性的阜阳方言程度副词以及有关句式,从程度副词的特性、句法、语义和程度量以及相关句式特点、功能和来源等方面进行分析研究,揭示阜阳方言程度副词的特征、规律和语言学价值。此外,还对阜阳方言中程度副词与普通话中对应的程度副词做了比较。本文主要采用描写与解释、归纳与比较等研究方法,从语法化、
对于天然气管道来说,对管道发生泄漏与否进行有效的判断是个关键问题,目前石油管道上比较通用的管道泄漏检测方法由于存在定位不准确、适应性差等问题,使得在天然气管道检测
针对低渗透率、零散的小区块油田开采的同井采注水过程中,潜油电泵的过流部件出现的冲蚀磨损现象,建立基于数值模型的固液两相湍流和冲蚀磨损的数学模型不仅具有较强的理论意