基于Hadoop平台的作业调度算法研究与改进

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:ding7881
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,云计算技术的发展极为迅速,Hadoop平台作为云计算技术的核心实现,也得到了广泛的应用和发展。Hadoop平台通过网络互连将大量的计算机连接成为一个集群,用户可以通过客户端向集群提交作业来完成实际的应用需求。资源调度器作为Hadoop平台的核心组件,采取特定的调度算法对用户提交的作业进行资源分配和调度执行,调度算法的优劣直接影响着整个集群的性能,决定着为用户提供的服务质量。因此对Hadoop平台作业调度算法的研究和改进非常重要。本文通过研究Hadoop YARN内建的三种作业调度算法,指出其不足,从而在此基础上提出了一种新的算法,称为Dependency Scheduler。本算法主要针对Hadoop集群的资源使用率进行了优化,并着重考虑了Map Reduce作业的map任务和reduce任务之间的依赖性问题,通过初始任务选择和实时任务选择两个阶段,调度任务的执行,最终达到最优化使用集群资源和最小化MapReduce作业集完成时间的目标。最后通过自主搭建Hadoop集群来做性能比对,实验使用了四种标准的测试程序作为工作负载,从节点CPU使用率、节点内存使用率及作业集完成时间三个方面,将本文提出的Dependency Scheduler算法与Hadoop YARN内建的三种算法进行比较。实验结果证明,相比之下,本文提出的Dependency Scheduler算法在资源利用率和作业集完成时间两个方面的性能得到明显提升。
其他文献
本文根据短波宽带信道对数据传输的影响和正交频分复用(OFDM)技术自身的特性,设计了一种短波宽带OFDM数据传输方案。文中重点研究系统方案中的两个关键技术:系统的时频同步和
WDM技术充分利用光纤的通信窗口,将多个光业务流复用到一根光纤中,允许灵活的扩展带宽,降低复用成本。自诞生以来,在长途传输等应用环境下表现出的卓越的性价比优势,应用领域迅速
期刊
在图像处理中,图像彩色化技术是研究的热点之一,彩色化的效果、速度以及自动化程度一直是研究的重点。本文主要对图像自动彩色化方法做了一些研究,详细分析了基于颜色转移的彩色
智能视频监控是计算机视觉中视频分析技术的一个重要应用方向,尤其是在安防、交通监控领域担当着重要角色。其中,运动目标的分类识别是智能视频监控系统的重要组成部分,通过
非线性调频信号广泛应用在通信、雷达、声纳以及地震信号处理的很多领域中。在这些领域中,检测噪声或者杂波背景下的未知非线性调频信号和估计其瞬时频率曲线已经成为一个重
TD-SCDMA作为由中国自主提出的第三代移动通信网络标准,它是以TDD和CDMA技术为基础,充分结合了智能天线、联合检测、功率控制等先进技术,具有极高的频谱利用率与频谱灵活性。
织物的起毛起球性能评价是纺织品检验领域的重要内容。通常采用的方法是标准样照对照评级,主观性强,不能对织物的起球程度作精确定量的描述。利用图像处理技术进行纺织品起毛起
无线自组织网络是一种无需基础设施,可快速组网的广泛应用的无线移动网络。它具有与Internet有线网和移动蜂窝网不同的动态拓扑和多跳路由等特性。这些性质导致其网络容量受
在机载雷达所面临的真实环境中,杂波功率非均匀、干扰目标和孤立干扰等多种非均匀现象往往是同时存在的,而目前研究的大多数非均匀检测方法都仅适用于只存在其中某一种非均匀