“神威·太湖之光”上某流体力学应用的任务图并行化研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:Adisc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,众核处理器的不断发展,对并行编程模型在并行编程简单化、高并行效率方面提出了高的要求,成为了高性能计算领域的研究热点。“神威·太湖之光”是我国自主研发的高性能众核平台,申威众核处理器支持加速线程库和OpenACC并行编程模型。其中,加速线程库采用修饰符(Modifier)的方式来对局部数据存储器(Local Data Memory,LDM)空间中的常量或者变量进行定义,用户直接对线程和LDM空间进行分配和管理,编程层次较低。申威并行编程模型OpenACC以编译制导的方式实现应用程序并行化,并提供对中间代码的二次开发解决方案,解决仅靠编译制导方式存在的计算性能局限问题,但申威OpenACC并未发掘不同任务之间的LDM数据重用。AceMesh任务调度系统在多核众核平台实现针对网格应用的并行调度。通过API接口的方式自动发掘结构化网格应用中存在的数据驱动任务图的并行性,并提供多种手段发掘任务图执行中的数据局部性,克服多核、众核平台带来的编程挑战。本文基于“神威·太湖之光”的申威众核处理器,在对某流体力学应用的OpenACC并行版本分析研究的基础上,实现该流体力学应用的任务图并行优化,并对其进行调优和性能评估。具体地,在已有的申威众核平台上AceMesh任务调度系统上,实现了某流体力学应用的任务图并行化。在分析DMA访问机制特点的基础上,保持已有的进程网格划分方式,在线程层面实现任务图并行。然后,采用数据对齐、合并传输等方式来加速DMA传输速度。通过数据打包、数组维序转换等方法在任务内实现存储优化,任务间采用数据重用方式进行优化。最后,对比已有的OpenACC优化版本,得到各计算核心的性能提升,其中algorithm01获得2.4倍加速度,algorithm03获得2.39倍加速度,fcta01获得2.76倍加速,fcta 02获得2.79倍加速,fita获得1.18倍提升,fksi获得10.42倍加速,gauss02获得1.20倍加速,应用整体获得近2.5倍提升。
其他文献
管道位姿测量系统是测量水下管道相对位姿的关键设备,在水下回接作业中有着广泛的应用。课题的前期研究为国家“863”计划重大专项“深水管道铺设技术”中的子课题“深水回接
现代社会中,警察成为国家对社会进行控制管理的重要手段,是国家意志的体现。湖北由于其境内水域多、水道长的特性,水上警察局就成为湖北省政府对全省水域进行管理的重要机构
微透镜阵列以其独特的光学性能广泛应用于航空、航天和光学制造等领域。实现大面积小单元尺寸微透镜阵列的高效低成本加工仍是微透镜阵列加工的技术难点。精密模压成形技术可有效解决微透镜阵列制造的效率问题。微透镜阵列模压成形质量很大程度上取决于其模具的几何精度和表面质量,因此,微透镜阵列模具的精密加工是微透镜阵列高质量精密模压成形的关键。微细铣削技术因其独特的优势,是实现复杂几何微透镜阵列模具高效率和高精度加
本研究针对工业蜗轮蜗杆传动中的蜗轮用QAl10-4-4铝青铜产品工业测试通过率低、表面性能不稳定等问题。通过使用振动研磨工艺对成品蜗轮进行处理来代替热处理工艺获得合格成品。以涡轮用QAl10-4-4铝青铜为研究材料,采用振动研磨处理工艺,模拟工况过程和相关参数,实验室系统研究不同振动研磨处理工艺下的材料组织及相关表面性能的影响规律,并阐述与解释振动研磨处理工艺对铝青铜蜗轮零件表面性能强化的机理机理
等熵磁气体动力学系统可用来描述具有等熵的可压缩流体在横向磁场作用下的运动规律.本文考虑一类广义等熵磁气体动力学系统的初值问题.第一章,介绍等熵磁气体动力学系统以及零压流系统的研究现状,并简述本文的研究工作.第二章,介绍广义零压流系统的黎曼解.第三章,研究广义等熵磁气体动力学系统的黎曼问题及其黎曼解当压力和磁场都消失时的极限行为.首先,在一般的气体状态方程下,使用特征分析法和相平面分析法,讨论广义等
自修复复合材料能够自主检测及修复微裂纹,具有延长材料使用寿命、降低维护频率、减少成本等优点,在航空航天、交通、医疗、建筑及电子科技领域具有广阔的应用前景。近年来,微胶囊自修复复合材料的应用得到研究者的广泛关注,是功能聚合物材料领域的研究热点。微胶囊囊芯中有效修复成分的含量直接影响微胶囊自修复复合材料的修复效率,微胶囊在基质材料中的分散性,也对自修复性能有影响。因此,微胶囊囊芯物质的调控及壳层材料的
刑事科学技术作为刑事侦查、刑事诉讼不可缺少的重要组成部分,承担着刑事案件现场勘查、证据提取以及检验鉴定等工作职能,在案件侦办、提起诉讼等工作中均发挥着不可替代的关
煤岩作为一种天然的非均质材料,内部包含大量的缺陷,包括裂隙,孔隙和节理裂缝等,这为地下水的贮存和运移提供了场所。渗流场与应力场的耦合作用让煤岩的破坏机制变得十分复杂
随着软件功能的日益复杂以及可定制性的不断提高,软件配置变得越来越复杂,配置故障逐渐成为系统失效的主要原因之一。当前,大部分研究工作主要集中在配置故障发生后的被动诊
在本文中,我们就几类脉冲非线性分数阶微分方程做定性研究.根据脉冲非线性分数阶微分方程非线性项的不同特点,选取了应用变分方法中的临界点定理来研究这几类脉冲非线性分数阶微分方程的工作空间,并构造了这几类脉冲非线性分数阶微分方程对应的变分泛函,然后应用临界点定理研究了解的存在性和多解性等定性问题.论文中,我们首先介绍了分数阶微分方程的研究背景、应用及现状,以及本文主要研究的问题.然后我们用Bonanno