基于GPU求解椭圆型偏微分方程的并行算法的研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户：fangrong87

【摘要】

：

在等离子体数值模拟中,通过椭圆型偏微分方程求解电磁场是不可或缺的一步。随着模拟规模的不断扩大,计算时间也越来越长。因此在求解方程的算法上进行并行加速研究以减少方程

【作者】

：

曹建伟

【出处】

：

大连理工大学

【发表日期】

：

2014年期

【关键词】

：

椭圆型偏微分方程 DRM FACR(L) GPU

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在等离子体数值模拟中,通过椭圆型偏微分方程求解电磁场是不可或缺的一步。随着模拟规模的不断扩大,计算时间也越来越长。因此在求解方程的算法上进行并行加速研究以减少方程的运算时间,提高等离子体模拟的效率是很有意义的。因此本文进行了多种算法的基于GPU并行加速的研究。绪论部分重点介绍了GPU发展以及CUDA(Computer Unified Device Architecture)的形成。第二章为雅克比迭代算法的GPU并行加速。本文基于雅克比迭代的算法分析、线程分配和存储器选择,提出了一种GPU加速模型。即采用循环体内BOOL值判断的方式消除迭代算法中的数据复制语句ST2,减少了循环体内设备与主机之间线程的切换与计算权利的传递,并且减少了及内存的访问量,从而缩短了运算时间。另外采用纹理存储器存储设备上的数据,减少了数据复用现象,进而减少了GPU的数据读入时间。利用该模型对二维拉普拉斯方程进行了求解,最终结果显示GTX570的最高加速比能达到24倍以上,加速比效率可以达到50%以上。 GT430最高加速比能达到3倍左右,最高加速比效率可以达到60%以上。由GPU的计算精度与串行计算精度的比较可以发现,GPU+CPU的异构模式更加适合进行大规模高精度运算,在没有达到峰值运算能力时,运算规模越大往往加速比越高。为了进一步在算法上提高计算效率,本文引入了DRM(Dimension Reduction Method)和FACR(L)(Fourier analysis-cyclic reduction)两种非迭代型综合算法,并且提出了这两种算法的一种基础性GPU加速方法。首先通过修改FACR(L)算法的计算步骤,调整该算法中FFT算法与循环约化算法运行时间的比例,使运算时间集中于FFT部分。然后采用CUFFT库对计算量较大的FFT部分进行了加速,通过多种方法减少数值与设备间的数据传输,最终达到了提高计算效率的目的。另外本文采用多个实例对DRM与FACR(L)算法的并行加速程序进行了验证比较,测试了不同类型的GPU加速性能。通过对直角坐标系下的拉普拉斯方程、直角坐标系下赫姆霍兹方程、柱坐标系下泊松方程以及柱坐标系下赫姆霍兹方程的求解,得到了在保证计算精度的前提下,GTX570最大加速比为3.8,最大加速比效率为15%的结果；而相应的GT430最大加速比为1.8,最大加速比效率为60%。随着网格数的增加整个程序的加速比在增加,但是由于显存容量的限制,仅得到了一定程度上的加速,与理论值差距较大。

其他文献

乡村文化旅游与农村经济协调发展研究

乡村文化旅游历史悠久,在欧美等发达国家已呈现出多样化和规模化的态势。我国乡村文化旅游是近年才兴起的,它起步晚、发展迅猛,因投资少、见效快等优势,目前已成促进农村经济

期刊

乡村旅游业文化资源经济协调发展

国内网络表情包文化研究综述

表情包作为网络文化的典型代表之一,近几年愈加受到学界的关注。本文梳理了近十年来国内网络表情符号领域的研究现状,发现除了从艺术设计和计算机技术角度的研究之外,学者对

期刊

网络表情包网络文化

消费类电子产品的外观识别

目的研究消费类电子产品的外观识别，提高消费类电子产品的外观可识别性。方法通过整理以人为本的用户交互界面设计的相关文献资料，厘清消费类电子产品的外观识别研究意义，结合市

期刊

外观识别消费类电子产品设计思想

建筑业上市公司无形资产对生产效率的影响研究

无形资产具有价值高、效益高、增值性强的特点,对现代企业转型升级和赢得市场竞争起一定推动作用。我国建筑业在改革开放后取得快速发展,然而产值增长并不代表行业发展水平良好,还需从投入产出角度,用生产效率评价经济活动的实际效果。目前建筑业总体仍属劳务密集型、粗放式发展模式,企业生产效率不高,这与无形资产重视不足有一定关联。基于此,本文以无形资产对生产效率的影响展开研究,试图找到提高建筑企业生产效率的途径,

学位

建筑业上市公司无形资产生产效率面板数据模型灰色关联分析

如何打造初中英语高效课堂

初中英语课堂是老师和学生在一起进行课堂互动教学的一种方式,新课改要求打造初中英语高效课堂,旨在提高初中生学习英语的积极性,发挥自身能动性,学会创新分析和解决问题的能

期刊

打造初中英语高效课堂

温湿度对SIKA聚氨酯胶粘剂工艺性能的影响

研究了环境条件主要是温湿度对聚氨酯胶的表干时间、固化速率、初始剪切强度、粘接性能的影响。试验表明,对于结构粘接级别为A1和A2级的部件,SIKA 265、SIKA 221、SIKA 252胶

期刊

聚氨酯温湿度工艺性胶粘剂

从高速增长到高质量发展——中国改革开放40年回顾与前瞻

通过发挥自身的组合优势和承接国际产业转移,我国经济实现了30年高速增长。国际金融危机后,经济发展进入了新时代,基本特征就是已由高速增长阶段转向高质量发展阶段。在本轮

期刊

经济发展阶段新“中心—外围”产业升级金融深化制度性交易成本

基于FP_tree的频繁项目集增量式更新算法

对频繁项目集的更新问题进行研究,提出一种基于频繁模式树的频繁项目集增量式更新算法。充分利用已有挖掘结果,有效解决最小支持度和事务数据库同时发生变化时相应频繁项目集

期刊

数据挖掘关联规则频繁项目集增量式更新频繁模式树

乡镇农业产业化升级提速的对策研究

在农业的产业化升级过程中,由于产业结构、生产要素、市场等方面存在的问题,制约、影响了产业升级。农业的产业化升级关系着农村经济的发展,要促进农业产业化升级,要从多方面

期刊

农业产业化升级提速农村土地流转农业融资

刍议党内法规建设

党的十八大以来,党内法规建设取得了长足的进步,截至2019年9月,中央有关部门制定和修订了180多部中央党内法规。我们在看到进步的同时,也要认识到一些制约党内法规发展的深层

期刊

党内法规党内规范性文件科学性

基于GPU求解椭圆型偏微分方程的并行算法的研究

与本文相关的学术论文