非结构CFD软件MPI+OpenMP混合并行及超大规模非定常并行计算的应用

来源 :航空学报 | 被引量 : 0次 | 上传用户:star51324
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
常规工程应用中,非定常数值模拟(如多体分离)的计算量十分巨大,如果为了达到更高的计算精度,加密网格或者采用高精度方法将会使得计算量进一步增大,导致非定常数值模拟在CFD工程应用中成为十分耗时和昂贵的工作,因此,提高非定常数值模拟的可扩展性和计算效率十分必要.为充分发挥既有分布内存又有共享内存的多核处理器的性能和效率优势,对作者团队开发的非结构网格二阶精度有限体积CFD软件(HyperFLOW)进行了混合并行改造,在计算节点间采用MPI消息传递机制,在节点内采用OpenMP共享内存的MPI+ OpenMP混合并行策略.首先分别实现了两种粒度(粗粒度和细粒度)的混合并行,并基于国产in-house集群采用CRM标模(约4000万网格单元)定常湍流算例对两种混合并行模式进行了测试和比较.结果 表明,粗粒度在进程数和分区数较少的小规模并行时具有效率优势,16线程时效率较高;而细粒度混合并行在大规模并行计算时具有优势,8线程时效率较高.其次,验证了混合并行在非定常计算情况下的可扩展性,采用机翼外挂物投放标模算例,分别生成3.6亿和28.8亿非结构重叠网格,采用对等的(P2P)网格读入模式和优化的重叠网格隐式装配策略,网格读入和重叠网格装配耗时仅需数十秒;采用3.6亿网格,完成了非定常状态效率测试及非定常分离过程的湍流流场计算,在in-house集群上12288核并行效率达到90%(以768核为基准),在天河2号上12288核并行效率达到70%(以384核为基准),数值模拟结果与试验结果符合良好.最后,在inhouse集群上采用28.8亿非结构重叠网格进行了4.9万核的并行效率测试,结果显示,4.9万核并行效率达到55.3%(以4096核为基准).
其他文献
天津滨海新区具有发展区域经济的特点,新区面积较大,内部结构复杂,其中有塘沽区、汉沽区和大港区三个行政区,也有天津港、天津经济技术开发区和天津港保税区等经济功能区,还有中海
学位
目的:研究上海市各级医院运营现状和部分医疗服务项目的价格扭曲程度,为政府今后完善医疗服务价格体系提供决策依据和政策建议。 方法:采用文献查阅、文件回溯、专家访谈、数
中央政府非税收入是政府财政收入的重要组成部分,加强中央政府非税收入管理是政府非税收入管理的重要内容。近年来随着公共财政改革的不断推进,政府非税收入改革的步伐不断加快,中央政府非税收入增长很快,但随着改革的不断深入,管理问题日显突出,亟待加强。本文从我国中央政府非税收入管理的实际出发,采取理论与实践相结合,通过全面分析与重点分析相结合的方法,在充分理解政府非税收入理论和了解国外政府非税收入管理经验的
外形偏差是典型的叶片气动不确定性影响因素,考虑几何设计参数不确定性影响的叶片稳健性气动设计优化(RADO)有助于提高叶片平均气动性能及气动稳健性.首先,介绍RADO的基本原
孟德斯鸠曾说,凡有权力之人都易滥用权力。进入21世纪,随着我国社会主义市场经济体制的逐步建立和完善,来自世界经济全球化的压力,对公共权力系统中占重要组成部分的行政权力构成
现当今,我国经济发展十分迅速,而压力容器属于特种设备,被广泛应用于石油、化工等领域,在一定程度上代表着我国工业化发展水平.压力容器制造过程非常复杂,因此不可避免地会产
本文以新农村文化建设为切入点,在公共产品供给理论、文化贫困理论研究的基础上,采用文献检索、问卷调查、重点访谈、实地考察与理论分析相结合的研究方法,以探讨农村公共文化产