非结构网格Eular方程求解器GPU加速技术研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:yw101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算流体力学问题的求解中,基于非结构网格的求解器渐渐地成为主流研究方向,但是GPU通用计算发展近10年,GPU上的求解程序还是以结构网格的程序为主,基于GPU的非结构网格程序大多采用隐式格式,而对于CFD中广泛使用的显式格式,非结构网格下的GPU求解器很难达到较高的加速比。GPU通用计算发展几年来,架构更新换代很快,一些原本被研究人员公认的优化理念和方法可能并不适合非结构网格的CFD求解,一些优化方法随着产品的更新换代可能已经失去了效果。   本文在GPU平台上实现了非结构网格有限体积法求解器,并结合Fermi架构的硬件特点,对GPU上的程序进行再次优化,大幅提升了加速效果。本文的主要内容和成果如下:   1.介绍了非结构网格上的有限体积法求解过程,并行处理器的发展以及GPU从显示部件慢慢进化为并行处理器的历程,详细描述了最新的Fermi架构作为并行处理器的新特性。   2.将二维非结构网格的Eular方程有限体积法求解器移植到GPU平台,使用了结构体的数组到数组的结构体转换、减少数据传输、循环展开、指令优化等加速方法,对GPU程序进行优化,并与CPU程序作对比。   3.提出了调整非结构网格数据的存储顺序、降低warp占用率等方法,针对非结构网格求解程序在GPU上加速困难的原因,结合Fermi架构的硬件特点,在原来的基础上大幅提高了性能,深度挖掘了GPU的计算潜力,原本加速10倍的GPU程序,经过优化,最终相对于CPU加速约40倍。
其他文献
随着我国载人航天工程和地面互联网技术的快速发展,特别是建设载人空间站目标的确定,航天任务逐渐呈现多样性、长期性及国际合作的迫切性,这使得建设天地一体化互联网成为必然趋
网络虚拟化技术在未来互联网的研究中具有重要的意义,斯坦福大学提出的OpenFlow[1]技术由于其高度的开放性而受到了业界和学术界的欢迎,并且逐渐成为了网络虚拟化的主流技术。
随着云计算和大数据的发展,云数据中心的基础实施承载了大量的应用,云基础设施在运行过程中会产生大量的告警。由于云数据中心的基础设施规模庞大,导致云数据中心的告警产生规模
对程序进行分析和验证是当今计算机程序设计研究领域的前沿课题,如何保证程序按照人的预先设定严格执行而不出错是当今信息科学和可信计算技术与理论研究中的核心科学问题。近
Duckling是一个基于互联网的科研协同软件套件。“科研在线”是基于Duckling的一个应用,用于面向团队分享信息和知识,支持协同编辑和社会化沟通模式。科研在线能够让用户灵活地
随着人类生产活动不断发展和壮大,现代项目管理也越来越成为理论和实践关注的热点和焦点问题。在最近几十年里,项目调度问题也越来成为项目管理的核心领域,也吸引者众多学者和专
随着多媒体技术和网络的发展,人们对图像压缩技术提出了更高的要求,不仅希望它具有良好的压缩效率,而且还能灵活处理压缩码率。作为空中机器人的无人驾驶飞机,在民用领域可用于大
为保证移动节点在移动过程中会话的连续性,IETF提出了基于主机的移动IPv6协议(Mobile Internet Protocol version6,MIPv6)。MIPv6需要移动节点参与移动管理,降低了移动节点的续
互联网的飞速发展,为人们的生活带来了极大的便利,并逐渐成为人们获取信息的主要来源。但同时,在互联网上海量的图像中,存在大量的成人图像。这些色情内容极大地影响了儿童和青少
视频运动对象跟踪是计算机视觉的一个基本问题,具有广阔的应用背景,可以应用到视频监控、视频分析、机器人和智能人机交互领域。运动对象跟踪的主要目的是获得跟踪目标在视频的