面向众核系统的块Gauss-Seidel/Jacobi预条件子空间迭代法

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:lfs888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大规模科学与工程计算应用对计算需求的不断增长,推动着高性能计算机系统计算能力迈向E级。未来E级系统在提供巨大计算能力的同时,也将给传统数值并行算法带来巨大挑战和机遇。NKS(Newton-Krylov-Schwarz)算法作为求解大规模非线性方程组的求解器,在并行计算领域具有广泛应用。面向未来的E级系统,NKS算法将会产生全局通信瓶颈和无法充分利用异构众核架构并行性等问题,这对算法性能和可扩展性造成巨大影响。基于这一问题,研究了面向众核系统的块Gauss-Seidel/Jacobi预条件子空间迭代法,主要包括以下三个方面:1、针对Krylov子空间迭代法中存在的全局通信瓶颈,基于LogP模型建立了一套全新的算法性能模型,该模型定量分析得出了Krylov子空间迭代法在大规模节点的情况下产生的全局通信瓶颈。在此基础上,提出并实现了对PETSc高性能计算工具箱中GMRES、Chebyshev、Richardson、TCQMR四种Krylov子空间算法中包含的向量内积、范数和标准化步骤进行非阻塞式通信优化策略。在天河二号超级计算机平台上对MPI_Allreduce和MPI_Iallreduce接口进行性能对比,最高测试到65536个进程。对比结果表明,MPI_Iallreduce在进程规模达到1024时,其性能开始明显好于MPI_allreduce,且性能优势随着进程规模的扩大而不断扩大。最后采用二维方腔顶盖驱动流作为算例,在天河二号超级计算机平台上对优化效果进行了验证,结果表明,优化后的Krylov子空间迭代法具有良好的可扩展性,在进程规模达到1024时,优化后的Krylov子空间迭代法比优化前的方法性能提升了16%~26%不等。2、针对非结构网格问题,提出并实现了面向异构众核架构的块Gauss-Seidel/Jacobi预处理算法,将其作为区域分解算法的子区域求解器。通过数学推导证明了块Gauss-Seidel/Jacobi算法的收敛性。使用高速列车外流场模拟这一真实算例在异构众核架构超级计算机平台进行数值实验的结果表明,基本的块Gauss-Seidel/Jacobi预处理算法具有良好的预处理效果和可扩展性,在使用32个进程计算时,基本的块Gauss-Seidel/Jacobi算法相比于串行Gauss-Seidel算法预处理过程的加速比达到2.86倍。3、基于基本的块Gauss-Seidel/Jacobi算法,针对国产众核架构处理器,分别提出并实现了多行块通信打包、计算与通信重叠和丢弃非关键元素数值优化三种性能优化策略。数值实验的结果表明,优化后的低通信复杂性块Gauss-Seidel/Jacobi算法对比串行Gauss-Seidel算法加速比最高能达到4.16倍。使用1040核的测试数据为基准,在核数达到33,280时,块Gauss-Seidel预处理算法的并行效率为61%。
其他文献
随着中国制造2025战略的发展,机械臂在智能制造中的应用越来越广泛,引入机器视觉的机械臂将传统的工业制造转入了智能化模式,不但提高了生产效率,而且改变了常规的生产格局。
本文从采样质量、测试系统和仪器、测试环境、分析方法和人员素质五个方面分析了目前影响环境监测质量的几大因素,并从减少分析误差、采样、质量控制(QA)的方法、趋势综合分析、质量控制(QA)标准评述等方面提出提高监测质量、数据质量的对策和建议。
随着绿色消费的兴起和发展,自我标榜的绿色产品也越来越多且其定价高低悬殊很大.到底什么产品才是绿色产品,绿色产品又应该如何定价?理解绿色产品应该从产品的整体概念三个层
本文阐述了计算机信息安全管理三个组件,结合笔者的实践经验,分析企业信息安全面临的风险,提出制定企业的计算机信息安全管理的策略,以及如何进行安全知识教育提高企业人员的
在家谱中新发现蔡元培六篇佚文。在梳理其写作背景、写作年代以及相关人物时,挖掘出蔡元培等人一些鲜为人知的史迹。这六篇佚文还蕴含了蔡元培的谱牒学理论,具有重要的史学价
百合种球生产过程中,不打花蕾会显著影响百合种球增大,打花蕾和直接打花头对百合种球的围径增大无显著差异.直接打花头在百合种球生产中更容易操作,又对百合种球生产的最终目
针对工程项目成本管理对象的单一性、工作的一次性、控制上的超前性以及系统的综合性特点,简要分析了工程项目成本核算的注意事项:一是要建立严密的成本核算组织体系;二是要把
程控交换机在煤矿通信系统中占有比较重要的地位。根据多年煤矿通信系统程控交换机的维护经验,列举了用户鉴权、黑白名单标志引起的用户无权以及目的码控制引起的某一局向无法