非结构网格Eular方程求解器GPU加速技术研究

来源 :中国科学院研究生院中国科学院大学 | 被引量 : 0次 | 上传用户：yw101

【摘要】

：

在计算流体力学问题的求解中，基于非结构网格的求解器渐渐地成为主流研究方向，但是GPU通用计算发展近10年，GPU上的求解程序还是以结构网格的程序为主，基于GPU的非结构网格程序大

【作者】

：

宋慎义

【机构】

：

中国科学院大学

【出处】

：

中国科学院研究生院中国科学院大学

【发表日期】

：

2012年期

【关键词】

：

非结构网格求解器计算流体力学有限体积法图形处理单元

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在计算流体力学问题的求解中，基于非结构网格的求解器渐渐地成为主流研究方向，但是GPU通用计算发展近10年，GPU上的求解程序还是以结构网格的程序为主，基于GPU的非结构网格程序大多采用隐式格式，而对于CFD中广泛使用的显式格式，非结构网格下的GPU求解器很难达到较高的加速比。GPU通用计算发展几年来，架构更新换代很快，一些原本被研究人员公认的优化理念和方法可能并不适合非结构网格的CFD求解，一些优化方法随着产品的更新换代可能已经失去了效果。　　本文在GPU平台上实现了非结构网格有限体积法求解器，并结合Fermi架构的硬件特点，对GPU上的程序进行再次优化，大幅提升了加速效果。本文的主要内容和成果如下：　　 1.介绍了非结构网格上的有限体积法求解过程，并行处理器的发展以及GPU从显示部件慢慢进化为并行处理器的历程，详细描述了最新的Fermi架构作为并行处理器的新特性。　　 2.将二维非结构网格的Eular方程有限体积法求解器移植到GPU平台，使用了结构体的数组到数组的结构体转换、减少数据传输、循环展开、指令优化等加速方法，对GPU程序进行优化，并与CPU程序作对比。　　 3.提出了调整非结构网格数据的存储顺序、降低warp占用率等方法，针对非结构网格求解程序在GPU上加速困难的原因，结合Fermi架构的硬件特点，在原来的基础上大幅提高了性能，深度挖掘了GPU的计算潜力，原本加速10倍的GPU程序，经过优化，最终相对于CPU加速约40倍。

其他文献

基于UPD协议的空间网关设计与实现

随着我国载人航天工程和地面互联网技术的快速发展，特别是建设载人空间站目标的确定，航天任务逐渐呈现多样性、长期性及国际合作的迫切性，这使得建设天地一体化互联网成为必然趋

学位

天地一体化互联网载人空间站空间网关设计VxWorks内核UPD协议可靠性机制

基于OpenFlow的虚拟网络隔离技术研究

网络虚拟化技术在未来互联网的研究中具有重要的意义，斯坦福大学提出的OpenFlow[1]技术由于其高度的开放性而受到了业界和学术界的欢迎，并且逐渐成为了网络虚拟化的主流技术。

学位

切片隔离网络环境模拟令牌桶过滤器队列调度

面向大规模基础设施的告警分析及实时响应

随着云计算和大数据的发展，云数据中心的基础实施承载了大量的应用，云基础设施在运行过程中会产生大量的告警。由于云数据中心的基础设施规模庞大，导致云数据中心的告警产生规模

学位

云数据告警预测方法有向概率图预测性能

程序终止性的分析和验证

对程序进行分析和验证是当今计算机程序设计研究领域的前沿课题，如何保证程序按照人的预先设定严格执行而不出错是当今信息科学和可信计算技术与理论研究中的核心科学问题。近

学位

程序验证终止性试差法复杂度上界周期点符号动力学

协同工作环境中适应用户兴趣变化的页面推荐

Duckling是一个基于互联网的科研协同软件套件。“科研在线”是基于Duckling的一个应用，用于面向团队分享信息和知识，支持协同编辑和社会化沟通模式。科研在线能够让用户灵活地

学位

内容过滤页面推荐动态用户兴趣模型协同工作环境科研在线互联网

考虑资源转移时间的多目标资源受限项目调度问题研究

随着人类生产活动不断发展和壮大，现代项目管理也越来越成为理论和实践关注的热点和焦点问题。在最近几十年里，项目调度问题也越来成为项目管理的核心领域，也吸引者众多学者和专

学位

多目标资源受限项目调度多目标优化资源转移时间自适应NSGA2_A算法

JPEG2000及其在无人机中的应用研究

随着多媒体技术和网络的发展，人们对图像压缩技术提出了更高的要求，不仅希望它具有良好的压缩效率，而且还能灵活处理压缩码率。作为空中机器人的无人驾驶飞机，在民用领域可用于大

学位

JPEG2000标准图像压缩无人驾驶飞机感兴趣区域小波变换编解码器

基于快速切换和指针推进的分布式移动IPv6优化方案

为保证移动节点在移动过程中会话的连续性，IETF提出了基于主机的移动IPv6协议(Mobile Internet Protocol version6，MIPv6)。MIPv6需要移动节点参与移动管理，降低了移动节点的续

学位

代理移动IPv6协议全分布式移动管理优化设计

基于内容的成人图像检测算法研究

互联网的飞速发展，为人们的生活带来了极大的便利，并逐渐成为人们获取信息的主要来源。但同时，在互联网上海量的图像中，存在大量的成人图像。这些色情内容极大地影响了儿童和青少

学位

肤色分割过滤算子支持向量机成人图像检测算法机器学习特征提取

基于表观建模和运动建模的跟踪技术研究

视频运动对象跟踪是计算机视觉的一个基本问题，具有广阔的应用背景，可以应用到视频监控、视频分析、机器人和智能人机交互领域。运动对象跟踪的主要目的是获得跟踪目标在视频的

学位

视频监控图像识别目标跟踪图像处理

非结构网格Eular方程求解器GPU加速技术研究

与本文相关的学术论文