论文部分内容阅读
分子动力学(MD)模拟是一种使用牛顿经典力学模拟微观粒子运动来获得原子体系的宏观性质的模拟方法。GROMACS是一款由格罗宁根大学研发的用来做分子动力学模拟的主流软件,目前已经经过几十个版本的加速优化,包括常见的MPI、OPENMP、GPU和SIMD等,优化体系十分完善,该软件功能强大,用户友好,能够满足几乎所有常见的原子体系模拟需要。目前,使用GROMACS软件来进行分子动力学模拟最大的问题是软件运行周期过长。2014年,由中国国防科学技术大学研发的“天河2号”超级计算机以其33.86petaflop/s的性能被国际Top500评为世界性能第一的超级计算机。“天河2号”拥有32000块CPU卡和48000块MIC卡,计算资源丰富,是国内最新的超算平台,在国内超算领域受到广泛认可。1、经过实际验证,GROMACS在“天河2号”超级计算机上运行时,只能使用CPU而无法使用MIC,没有充分使用“天河2号”超级计算机的计算资源。针对这个问题,本文分析了GROMACS软件在实现offload模式中的问题和困难,然后在此基础上,不断通过数据整合,多计算单元并行,使用新数据流等方式进行加速优化,并最终完成了单MIC卡上对GROMACS软件的offload模式的优化。该方法可以让GROMACS软件运行时,利用“天河2号”的MIC协处理器对软件进行并行加速。最终测试发现,offload模式的GROMACS软件取得了一定的加速效果。2、针对offload模式优化的GROMACS软件效率过低的情况,本文经过深入研究和分析,发现引入额外时间开销过大是制约软件效率的主要原因。通过使用新的数据流优化,多计算单元加速的方法,本文进一步减了offload模式的GROMACS软件的额外开销,提高了软件的并行度,在单节点上让CPU和MIC协同计算GROMACS的核心计算模块,令软件的性能有了质的飞跃,实现了使用offload模式对GROMACS软件的并行加速。3、在实际使用时,为了满足计算需要,GROMACS经常被跨节点使用。所以从实用性和可拓展性考虑,本文对跨节点的GROMACS软件进行了offload模式的并行加速。在实现过程中,本文将跨节点GROMACS软件的局部势能力和非局部势能力部分分别offload到MIC卡进行计算,并针对数据的不同特征将数据分为四种通信模式,减少通信开销,最终实现跨节点GROMACS软件的offload模式并行加速。总之,本文针对“天河2号”异构平台,在全世界范围内第一个实现了MIC卡上基于offload模式的GROMACS软件的并行优化,并取得了很好的加速效果。