论文部分内容阅读
网格计算的主要目的为整合互联网上广域的、异构的网络资源,实现跨域的协同工作和资源共享,为用户提供透明的计算能力。为了有效利用网格环境中的海量资源使得在尽量短的时间内正确且高效地完成相应的应用,任务调度成为网格系统中的关键问题之一。
当前网格应用正从面向独立任务的模式向更加复杂的模式转变。一个复杂的网格应用往往包含多种类型的计算任务,并通过一定的逻辑关系进行协同交互,可表示为网格工作流应用(如AMS海量数据处理应用等)。通常情况下网格工作流应用采用有向无环图(DAG)进行建模,此时针对网格工作流应用的调度问题即可转化为网格环境中DAG任务图的调度问题。目前已有相关调度算法大多假设相关调度参数(如任务执行时间等)都预先可知且始终保持不变。然而由于网格环境通常具有动态性与自治性,任务执行时间等参数可能随着时间推移动态变化,因此以上假设并非始终成立,此时已有相关算法无法有效保证应用的实际调度与执行性能。
基于此,为了有效适应网格环境的动态性,本博士论文针对动态环境下网格工作流应用的自适应调度机制展开研究,从造成网格性能动态性的本质出发,将任务实际执行时间的动态变化同资源本地负载相联系,面向不同网格环境(是否提供资源提前预留机制)分别提出相应的网格工作流应用(DAG任务图)自适应调度机制,以获得理想的调度与执行结果。根据以上思路,本博士论文的主要研究内容具体包含以下五个方面:
1)基于支持资源预留的网格DAG任务图调度算法:针对支持资源预留机制的网格环境,在分析已有调度算法存在的不足的基础上,研究如何更有效地对DAG任务图中各任务设置合适的优先级以及如何制定高效的任务复制与资源选择策略,以获得更优的调度性能。
2)网格计算资源本地负载自适应预测:针对不提供资源预留机制的网格环境中计算资源的特点,研究如何根据资源本地负载历史数据建立自适应预测模型,通过对模型相关参数进行动态调整,实现对该资源将来时刻负载值的有效预测,为任务调度提供有力支持。
3)基于负载预测的网格DAG任务图随机调度机制:在资源负载预测结果的基础上,研究如何对网格任务实际执行时间的概率分布进行有效估算,并在此基础上提出一种基于负载预测信息的网格DAG任务图随机1调度算法,使其能够根据资源动态性能变化自适应地进行调度,以保证动态环境下网格工作流应用的调度性能。
4)网格DAG任务图动态自适应重调度机制:针对网格资源负载变化规律较为复杂的情况,研究由于预测误差导致的对DAG任务图的调度执行性能的影响,并提出一种运行时自适应动态重调度机制,使得应用运行过程中能够根据最新系统负载预测信息自适应实时地对调度方案进行动态调整,以进一步保证网格应用的执行性能。
5)SEU-GJMS的设计与实现:在原有东南大学校园网格平台SEUGrid的基础上,研究如何设计并开发支持网格工作流应用的作业管理与调度模块(SEU-GJMS),并将相关理论研究结果部署其中。通过设计相应实验并运行预设的AMS海量数据处理应用实例以验证相
关理论研究成果在实际网格环境中的有效性。
通过以上五个方面的创新性研究工作,我们对动态环境下网格DAG任务图的自适应调度机制进行了深入地研究,通过一系列仿真实验以及在实际网格环境中的运行结果表明,本博士论文所提出的相关调度算法与机制能够在网格工作流应用的调度过程中有效解决由网格环境动态性所造成的影响,并能够获得较优的调度与执行性能,同时能够为AMS海量数据处理应用的有效执行提供有力保证,并为今后更多面向科学计算的网格工作流应用在实际网格环境上的成功运行提供参考。