论文部分内容阅读
在科学研究、商业信息处理等许多领域,都要进行高性能计算。作业管理系统是组成高性能计算环境的关键部分,它提供了作业提交、调度、执行及控制的新机制,可以充分利用网络中的各种资源建立一种高性能和高可靠性的分布式计算环境。对作业管理系统进行研究是一件很有意义的工作。 本文较深入的研究了典型的作业管理系统NQS,其目的是为我们开发新型的作业管理系统作一些准备工作。本文的研究工作和研究成果主要包括以下内容。 分析了为什么要引入和发展作业管理系统、作业管理系统应该包含的基本功能要素。 较深入的分析了NQS,包括NQS的作业管理功能、负载共享、系统结构等。通过分析指出了NQS在作业管理功能方面、负载共享方面、系统结构方面的不足。 针对NQS在作业管理功能方面的不足,介绍了笔者参与研究开发的WorkCenter作业管理系统,WorkCenter是对NQS的改进和扩充,本文总结了笔者在实现WorkCenter过程中遇到的问题和对这些问题的解决方法。 针对NQS在负载共享方面的不足提出了一种新的负载共享方法“分布式公平共享调度”(DFSS—Distributed Fair Share Scheduling),笔者只做了DFSS的设计,没有进行编码工作。 针对NQS在系统结构方面的不足提出了作业管理系统的“功能导向的模块化系统结构”,这种系统结构为我们设计新型作业管理系统提供了一个蓝图。