基于能量感知的Hadoop平台调度器研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:xiaozhenying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今各行各业的数据每天都在快速增加,学术界和企业发现这些数据中隐藏着巨大的价值。在这种需求下各种数据分析框架和平台发展起来,其中Hadoop是目前最流行的开源平台,该平台实现了Google提出的MAPREDUCE计算模型和GFS存储模型。近年来不断积累的温室气体正在改变全球气候,数据中心的建设也应该把低碳减排放在重要的位置;同时企业在数据中心电能方面的投入也越来越多。目前Hadoop集群中的主机数目正在不断的增加,数据中心能耗控制问题也越来越突出。因此从Hadoop平台方面研究如何减少Hadoop集群的能量消耗对于环境保护和减少企业成本具有重要的意义。结合Hadoop平台的工作原理以及MapReduce计算框架运行时环境的架构,本文确定了从资源与任务调度的角度在Hadoop平台中构建一套能量消耗控制的体系结构。使用先进先出算法的单队列调度器(FIFO Scheduler)和基于计算能力算法的调度器(Capacity Scheduler)是平台自带的两种常用调度器,通过对它们的测试和分析,总结出了这两种调度器对于构建Hadoop平台能量控制框架的缺陷和不足。基于原有调度器的不足本文设计并实现了基于能量感知的Hadoop平台调度器,该调度器中构建了一套能量控制的框架,并设计了两层调度策略来进行作业到资源的节能调度。本文设计的基于能量感知的Hadoop平台调度器具有以下两个特点:1)调度器可以调节和平衡Hadoop集群作业运行过程中的Qos和总能耗;2)调度器本身具有高效的调度策略。调度器的整体框架是基于多队列设计的,设计了两层调度策略来完成作业的任务到计算资源之间的动态节能匹配,两层调度策略具有高效性,并且时间复杂度是线性的;多队列中作业的分配使用了类似一致性hash的方法,保证了作业到队列的高效动态分配以及系统的高并发性。本文最后使用XCP(xen cloud platform)云平台构建了具有32台虚拟机的Hadoop集群环境。并在该集群环境中将本文设计的节能调度器与Hadoop平台自带的先进先出调度器和计算能力调度器进行了对比实验,实验对比的目标是在不同的作业输入情况下Hadoop集群使用不同的调度器时,作业运行总能量消耗和时间消耗两方面的性能;另一方面是对比本文设计的节能调度器自身在控制作业运行能耗和时间消耗的能力。实验结果表明本文设计的节能调度器具有较好的能量控制能力,同时不增加集群作业运行的时间消耗;本文设计的节能调度器在作业运行时间和能耗两方面也具有较好的调节能力。
其他文献
多媒体信息检索中的图像检索问题一直是研究领域中的热点。90年代初,人们提出了基于内容的图像检索方法(Content-based Image Retrieval,简称CBIR)。该方法摒弃了传统手工给图
随着网络技术的不断发展,网络规模的不断扩大,银行金融机构的企业信息化建设也在不断得到完善和改进,同时银行金融机构对金融自助设备的相关应用软件的灵活性、拓展性的要求也在
目前日渐成熟的分布式多层开发技术,降低了Web服务器的负载,已经成为当今企业应用的主流模式。中间件是分布式应用中最为关键的部分,使得开发者可以集中致力于应用逻辑。Object
随着Internet的飞速发展,网络的应用己经深入到社会的很多方面,Web上.IJ获得的服务急剧增多,网上信息呈指数级增长,同时使来自各领域的用户对信息的查找、访问、表示以及维护变得
三维地震参数是一个庞大的三维数据体,它能从不同侧面反映储集层的特征。通过对三维地震参数的分析,可以评估油藏表征的参数,如沉积相、构造和埋藏史、流体饱和度等。由于传统的
随着医院信息化系统的普及使用,在临床的诊断过程中产生了海量的医学资源,这些未经加工的医学资源中蕴涵着极为丰富的知识,然而,由于这些资源存储分散,组织无序,所以难以被利用。因
随着网络技术的发展,网络存储由于其自身的诸多优点正得到越来越广泛的应用。同时也出现了不同类型的网络存储架构,其中附网存储和光纤通道存储区域网是应用最为成熟和广泛的
随着计算机和网络技术的迅速发展,网络安全成为世界各国共同关注的焦点。入侵检测技术是继传统的安全保护措施之后新一代的安全保障技术。作为信息安全保障中的一个重要环节,它
图像修复是指填充图像内指定区域的缺损数据的处理过程。这项技术已经被广泛用于各个领域,包括医学图像的修复、文物的修复、犯罪现场的还原、电影胶片上划痕以及污迹的消除
在软件生命周期中,软件测试是保证软件质量的关键环节之一,随着面向对象技术的广泛应用,使得面向对象的软件测试的研究也越来越受到重视。但面向对象程序的封装、继承、多态