论文部分内容阅读
基于网格的高性能计算平台是一个基于广域网络的分布式异构计算平台,它借助于网格为高性能计算提供了一个公共的计算平台,以通用网络为基础,以网格中间件为桥梁,实现了各种高性能计算资源之间的互联互通、共享和协同工作。与传统的高性能计算系统有很大的区别,它为实现大范围异构分布环境下的高性能计算提供基础软硬件环境、相关协议、公共服务、使能工具以及系统管理等功能。开展基于网格的高性能计算平台相关理论与技术的研究开发具有非常重要的理论意义和实际应用价值。本文以构建基于网格的高性能计算平台为目标,探索构建该平台的关键技术问题,主要围绕着基于网格的高性能计算平台的体系结构、资源虚拟化技术、资源分配和任务调度技术以及资源管理技术展开研究,并在该平台上部署并行多群体协作PSO框架以及高性能并行计算系统,使其能够成为执行计算机辅助工程(CAE)应用的理想平台。主要研究成果如下:以面向服务的观点提出基于网格的高性能计算平台体系结构,为该平台的设计实现、改进和优化运行提供坚实的理论基础,为其应用到制造系统中做出有益的理论探索。为了达到充分的资源共享和协作使用目的,在面向服务的网格高性能计算环境中,采用了资源虚拟化技术,即将不同的资源实现封装成一个通用的服务接口,并且这些服务接口有着统一的服务语义。针对基于网格的高性能计算平台的特点,作者将蚁群优化算法与网格调度技术相结合提出了一个改进算法。该算法将资源分配与任务调度这个NP难问题映射到任务资源分配图的优化选择问题上来最优化资源分配和任务调度,同时将信号量机制引入到最优任务资源分配图中来解决任务资源间可能的死锁问题。目前,尚无采用OGSA/WSRF结构的网格服务中间件能够很好地支持基于服务质量协商的网格资源管理,针对服务质量协商所涉及的协商资源预留问题和资源服务过程中服务质量的动态重协商问题,在对WS-Agreement规范进行一定的补充和完善后,基于WSRF设计了支持服务质量协商的网格资源管理体系结构并实现相应的服务框架,最终成功地将该服务框架应用到基于网格的高性能计算平台中。基于服务级协定和本文设计的并行多群体协作PSO算法实现了一个应用在基于网格的高性能计算平台上的并行多群体协作PSO框架。该框架为评价任务提供动态发现和选择计算资源功能以及协商服务质量功能,同时还能够屏蔽复杂的网格高性能计算环境,从而加速解决科学工程、制造业中涉及的优化设计问题。在探索网格与并行计算理论的基础上,作者借助于Globus Toolkit和MPICH-G2组件技术,设计并实现了基于网格的高性能计算平台上的并行计算系统,为复杂CAE应用能够在基于网格的高性能计算平台上执行搭建了一个高性能并行计算环境,不仅有效地提升了CAE应用的协同执行性能,而且提高了各类CAE软件资源的共享性,从而提高企业产品开发流程中计算分析阶段的计算效率,并大大降低了计算成本。