论文部分内容阅读
该文研究工作由两部分组成.其一是SMP机群编程模型研究.该文通过分析SMP机群体系结构的特点和SMP机群编程模型的现状,提出了细粒度并行化的OpenMP+MPI混合编程模型.通过对该模型的实现机制、并行化粒度、循环选择、优化措施和注意问题等多方面的研究,我们得出该模型兼顾了计算性能和易用性,非常适合SMP机群.为了检验该模型,我们在曙光3000上使用该模型,编程实现了一些典型实例,例如显式Laplace方程组求解、NAS基准测试程序CG等.通过对这些实例运行结果的性能分析,得到了一些有关SMP机群和编程模型的重要结论,并验证了我们的模型可以在SMP机群上取得良好性能.该文另一研究工作是机群系统并行调试研究.该文探讨了机群系统并行调试的主要困难所在和并行调试的主要技术,并从软件工程的角度分析研究了并行调试器的设计与实现.在这些研究的基础上,我们为曙光3000设计和实现了远程并行调试器RPB.RPB同时支持调试MPI或PVM、C或Fortran的并行应用程序,实现了记录/重放并行调试功能,支持循环调试,为解决并行调试的不确定性问题提供了有效方法.RPB采用客户端/服务器体系结构,具有友好的图形用户界面,客户端和服务器之间的通信采用CORBA技术实现,系统主要采用Java语言开发,具有良好的可移植性和可扩展性.该文从系统介绍、设计思想、技术路线、实现方法和性能测试等方面介绍了为曙光机群开发实现并行调试器的工作.