CPU-GPU异构数据流优化及其在气动力数值算法中的应用

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:jiashi098
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着气动力学中的数值计算的复杂程度日益扩大,数据规模不断增加,采用传统多核处理器和高性能CPU提升处理效率的方式已经不能满足科学计算的需求,迫切需要利用并行计算技术实现数值计算的高效处理,从而应用程序的效率。目前GPU并行计算技术的发展已经成熟,拥有强大的浮点数计算能力和良好的可编程性,采用CPU-GPU异构体系结构已经成为高性能计算机系统的发展趋势之一。本文面向CPU-GPU异构计算环境,利用NVIDIA提供的CUDA平台进行开发,围绕异构计算中数据流的优化关键技术展开研究,分析基于GPU数据流处理模型框架,阐述应用程序的执行过程、数据流的来源以及数据流具体的处理流程。利用Kepler架构中的Hyper特性优化数据流的处理,使用设备上纹理内存降低访问延迟,同时分析线程块中线程数量的配置对程序效率的影响,从而进一步提升应用的处理效率。对数据流处理过程中出现的数据依赖性进行了描述,并提供了相应的解决方法。实验表明,本文中使用CPU-GPU架构计算的应用程序在整体性能上相比CPU上计算有10倍左右的加速。对于大规模的数据处理,本文进一步研究MPI-GPU并行编程构架,主机端CPU上采用主从模式,划分任务后,均等分配到其他计算节点上,同时计算节点之间使用MPI进行数据的通信,利用GPU进一步处理。在结构层次上实现了 CPU上的粗粒度并行和GPU上的细密度并行。对于GPU的上下文计算环境,研究多个CUDA访问同一个GPU时,上下文的初始化和切换情况,并分析切换时产生的开销。将新型的MPS技术应用在MPI-GPU架构上,使得多CUDA进程共享同一个上下文,消除切换开销,进一步提高性能。本文将气动力仿真程序应用在CPU-GPU和MPI-GPU异构体系结构上,利用GPU进行大规模的数据并行计算,优化处理过程中数据流,并提升了程序的计算效率,最后获得了一定的加速效果,达到了预期目标,对于GPU在其他领域的应用的研究具有一定的推广意义。
其他文献
新型农村合作医疗制度作为一项复杂的社会系统工程,其建立对于维护社会稳定、缓解社会冲突具有良好的现实意义,同时对提高农村人口身体素质、促进城乡和谐发展更是具有重要的
本文试图通过对2007年至2012年福建省永泰县新农合基金运行数据开展统计分析,采用文献研究与统计方法相结合的方法,重点开展该县参保人员住院病种人次和费用的数据统计分析.
我国农村人口基数大,农村人力资源丰富。随着我国经济社会的不断发展和经济全球化步伐的不断加快,中国特别是中国农村地区面临着巨大的变革,农村人力资源问题愈发凸显。目前中国
随着近年来经济的发展及各种政策制度的放松,我国农村劳动力转移已具有一定的规模,农村剩余劳动力向东部沿海及各大城市转移,从事非农产业,这不仅改变了他们自身的收入结构、提高
<正>20世纪80年代初期,在编写和协调《中国大百科全书——建筑·园林·城市规划卷》时,将风景园林学科领域确定为“传统园林学、城市规划和大地景物规划3个层次”(汪菊渊: 中
会议
氨酚曲马多片(及通安)是一种新型镇痛药,为曲马多37.5mg和对乙酰氨基酚325mg组成的复方制剂。它能通过多种途径抑制疼痛,广泛用于中度疼痛的治疗。其镇痛效果优于单独使用两种单组
详细介绍了布罗波尔等四种常用防腐剂的性质、特点、使用方法及注意事项,简要介绍了湿巾微生物污染现状,防腐剂的作用机理及防腐剂的复配。
由于城乡二元经济结构和相关政策的差异,我国的城乡公共产品供给的差距不仅没有随着经济的发展缩小,甚至还有进一步扩大的趋势,突出表现在基础教育投入不足、社会保障制度尚未完
随着经济的快速发展,国内对木材的需求量越来越大,森林资源的增长远不能满足经济社会发展对木材需求的增长,我国造林业面临着重大的发展机遇。但是由于我国面临着巨大的生态保护
集体林权制度改革自2003年在福建、江西、辽宁、浙江等省试点,2008年在全国范围内全面推进以来,已经走过了十年时间,且很多省份已经完成了集体林改的主体确权任务。但是通过比较