面向一种众核架构的宇宙学多体模拟

来源 :江南大学 | 被引量 : 0次 | 上传用户:szg6136755
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
宇宙学模拟对于天文学家了解非线性结构的形成和诸如暗物质、暗能量等物质的假想形式是必不可少的。普遍使用的纯暗物质无碰撞粒子系统是经典的N体问题模拟。高精度的模拟需要包含数千亿甚至数万亿粒子,因此需要极强的计算能力和高效的算法。宇宙学N体模拟一直是高性能计算领域的一个重要分支,国外相关研究团队多次凭借超大规模宇宙N体模拟项目获得戈登贝尔奖。“神威·太湖之光”是我国第一台完全自主研发的高性能计算系统,也是世界上首台峰值性能超过100PFlops的超级计算机。然而在“神威·太湖之光”上一直未见超大规模的宇宙学模拟。本文对中科院国家天文台自研的一款宇宙学N体模拟软件PHoToNs进行了深入的研究后,针对国产众核处理器SW26010独特的硬件结构提出了数个性能优化方案,对软件中模拟宇宙演化的粒子间作用力计算模块进行了重新设计,实现了用于宇宙学N体模拟、能够充分发挥国产超级计算机“神威太湖之光”的体系结构优势的软件SwPHoToNs。利用SwPHoToNs,我们在5,200,000个核上进行了包含6400亿个粒子的宇宙学模拟,获得了29.44PFlops的持续性能,并行效率为84.6%,计算效率为48.3%。本文的主要研究工作如下:(1)针对申威处理器内存限制和PHoToNs使用的Tree-PM算法。本文设计了一种MPI通信策略,改善了进程间通信计算的均衡情况和存储压力,以此获得更高的并行效率和模拟规模。并且基于此策略,我们利用主从核之间的并行性,对进程内部粒子引力计算和不同进程粒子间的引力计算两者设计了针对性的流水线并行模式。(2)针对申威处理器独特的从核阵列内存结构,我们通过申请冗余数组的方式消除了双树遍历方式和力的相互作用产生的引力重复计算。并且利用此冗余数组和在主核上针对计算任务的生成方式设计的排序方案,解决了并行计算的读写冲突问题。(3)为了充分发挥申威处理器的计算能力,我们针对申威处理器的内存层次结构,利用从核LDM和DMA两者很好的降低了数据读取的时间开销,并且针对DMA和计算设计了流水并行模式。我们对引力计算函数循环展开后进行了手动的向量化。通过对由于引力长短分裂的计算方法引来的两个十分耗时的超越函数,指数函数和误差函数进行多项式拟合,设计了两个函数的向量化版本来完成核心计算代码的整体向量化。
其他文献
半导体光催化技术是高效利用太阳能和治理环境污染的有效途径之一。由于二氧化钛具有化学稳定、毒性小、光催化氧化还原能力较高等优点,因此成为研究和应用最为广泛的一种半
固相微萃取(solid-phase microextraction,SPME)技术是一项新型无溶剂样品前处理技术。与石英纤维萃取头相比,以金属为基底制备的纤维萃取头,具有良好的热稳定性、机械强度和快
天体脉泽是一种极端非热平衡的现象,它为我们提供了研究一些特殊的天文环境,特别是在小尺度环境的物理和动力学研究方面,提供了一个极好工具。甚长基线干涉技术(VLBI)在脉泽
材料的发展为人类社会搭建起了进步的阶梯。正因如此,科学工作者开发新型合金材料的脚步从未停下。近年来,研究学者在大量实验的基础上提出了一种新的合金设计思路——多种主
脉冲星,常被认为是具有高速自转特征的强磁场中子星。脉冲星的自转轴和磁轴之间有一夹角,当脉冲星的辐射束自转一周,如果能扫过地球,就能接收到一个脉冲。脉冲星的偏振测量是
本学位论文运用先验估计、Rabinowitz分歧定理以及Leray-Schauder度理论研究了广义布鲁塞尔模型非常数稳态解的分歧行为.主要工作如下:1.考虑广义布鲁塞尔模型对应的稳态问题
矮牵牛(Petunia hybrida)属于茄科(Solanaceae)碧冬茄属(petunia)植物,花色品种丰富、花期长、是重要的花坛和盆栽花卉,在园林中应用极其广泛。矮牵牛生活周期短,栽培容易,基因组已测序成功,遗传背景清晰,农杆菌易转化等优点不但是转基因的理想模式植物,而且是观赏植物研究的模式植物。园林中许多植物栽培中往往需要多次人工打顶增加植物分枝数目以达到花朵繁茂的观赏效果,大大提高了
由于炸药的冲击起爆是一门多学科交叉的研究,涉及复杂的物理、化学以及流体动力学等问题,对冲击起爆的影响难以用单一的理论来得到一个普适的结论。经常根据理论得到一个定性
BiOCl是一类具有取向自发内电场的二维层状材料,在自发内电场作用下光生电子空穴分离还可以定向分离,从而表现出独特的铁电光伏效应。而稀土离子Eu3+离子是一类对外部环境具
基于井下良好的观测环境,研究人员逐渐将地震观测由地表转入井下。但由于观测井孔径的限制,井下地震计需要在原来地表摆放的地震计的基础上进行一些适应性改进。本文以中国地