CPU-GPU异构架构下共享内存管理策略的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户：zxw364963027

【摘要】

：

【作者】

：

汪梦萱

【出处】

：

北京工业大学

【发表日期】

：

2020年01期

【关键词】

：

异构多核 CPU-GPU 共享内存内存调度策略

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

异构多核处理器是一个或多个CPU和多个应用于特定领域的专用处理器核组成的系统架构,每个内核都有不同的结构和擅长的程序。对比同构多核架构,异构多核架构的优势在于能够并行执行各种要求的任务,将所有任务按照各自特点分配到合适的处理器上,全面提升运行效率。多个CPU与GPU核心集成在同一个芯片上会争夺系统资源,包括缓存、内存等,对资源分配技术带来了新的挑战。CPU-GPU异构架构中的核心争夺共享内存资源时,核心之间的访存请求会相互影响。首先来自GPU的内存访问请求会严重干扰到CPU的访存性能,同时多个CPU之间的访存请求在访问内存时会相互交织在一起,性能也会受到很大影响。另外,现代的内存请求调度策略平等地处理GPU多个核心的请求,不会考虑核心之间的访问延迟差异。经过验证,核心之间的访存延迟差异会增加访存的平均延迟时间。内存管理是异构架构必须考虑的问题。无论处理单元多快,如果内存请求处理的能力跟不上,整体性能也不会得到很大的提升。现有的共享内存管理技术大部分都是应用于同构多核CPU系统中,没有考虑到CPU和GPU之间的访存差异。少量异构多核内存管理技术也没有对GPU核心之间的延迟差异进行深入的研究。为了解决CPU-GPU异构多核共享内存存在的问题,本文提出了一个基于访存差异的内存调度策略,BMAD-MS(Memory scheduling based on memory access difference)。首先通过基础实验具体分析了CPU和GPU的内存访问行为,实验结果表明CPU和GPU的内存访问行为差异明显。进一步验证了核心之间的内存访问干扰以及GPU核心之间的访问延迟差异确实存在。基于分析结果,首先在内存控制器中仿照原有内存请求队列创建一个新的请求队列。内存控制器在接收内存请求时根据请求来源将CPU请求和GPU请求保存到不同的队列中,避免GPU请求对CPU请求的干扰。通过一个简单的随机数优化决策决定当前处理的是CPU请求队列还是GPU请求队列。针对CPU请求队列,实现一个动态存储体(Bank)划分策略。根据不同应用的内存特征,将应用请求动态地映射到不同的Bank集合中,在不影响Bank级并行度的同时消除多个CPU应用的内存请求干扰。针对GPU请求队列,进一步引入关键性衡量不同GPU核心之间的访问延迟差异,改进默认的FR-FCFS(First Ready-First Come First Service,先就绪、先到达先服务)策略,实现一个关键感知内存调度用来平衡GPU应用的访问局部性和关键性。为了准确地评估BMAD-MS对内存系统性能的影响,本文使用经典的gem5-gpu模拟器构建异构多核处理器架构来评估实验方案对系统性能的影响。gem5-gpu集成了Mc PAT和GPUWattch功耗模型实现能耗统计,分别选择SPEC CPU2006和Rodinia作为CPU和GPU应用程序的测试集进行实验验证。根据实验结果,同gem5-gpu应用的FR-FCFS相比,BMAD-MS平均提高了17%的系统性能,最高提升了21%,系统性能得到了显著提升。

其他文献

基于水系风道的江平新城建筑布局研究

在我国现阶段的城市建设中,建设“新城”已经成为普遍的城市现象。同时,城市气候在新城规划中的应用研究逐渐走入人们的视野,城市风道尤其引起规划者们的注意。但是,我国新城

学位

城市风道新城规划CFD模拟建筑布局

含间断系数扩散方程的格子Boltzmann方法

含间断系数扩散方程大量出现在工程应用领域,因此数值求解该类方程具有重要的意义。近三十年来,格子Boltzmann方法已成为计算流体力学领域中的一种重要的数值计算方法,因此研

学位

格子Boltzmann方法扩散方程Champman-Enskog展开光滑系数间断系数

一种二维非定常线弹性问题的自适应并行算法

非定常线弹性模型是描述弹性问题的重要数学模型.本文针对一种二维非定常线弹性模型,建立了时空方向分别采用有限差分和线性有限元离散的全离散隐格式,数值实验表明了格式在

学位

非定常线弹性模型自适应策略条件数估计代数多层网格法并行计算

不同温度和孔隙水压下砂岩卸荷力学特性试验研究

随着近年来水利工程和地下交通等建设的不断增加,地下空间的安全开挖及有效利用等问题越来越受到关注。开挖所带来的岩石变形与常规加载相比更为明显,同时,开挖工程周围赋存环境的变化也会影响岩石的形变。目前岩石卸荷的研究相对较少,因此,本文基于前人的卸荷研究成果,考虑在温度和水压(孔隙水压)等赋存环境下开展砂岩的卸荷(恒主应力差卸围压)力学特性试验研究。基于试验研究主要分析了不同赋存环境下砂岩的变形、强度和

学位

温度孔隙水压卸荷变形本构模型

Allen-Cahn方程的后验误差估计及自适应有限元方法

Allen-Cahn方程是一个典型的相场模型。本文针对Allen-Cahn方程,研究其有限元方法。构造了基于梯度重构的后验误差估计,设计了基于重构型后验误差估计的自适应有限元方法,并

学位

Allen-Cahn方程自适应有限元方法重构型后验误差估计

桦褐孔菌三萜对α-葡萄糖苷酶和α-淀粉酶的抑制活性及有效成分分离鉴定

近年来,糖尿病因其高发病率一直困扰着人类的健康,临床上用药单一且副作用大,从天然产物中发现新型抗糖尿病药物——α-糖苷酶/淀粉酶抑制剂成为研究热点。桦褐孔菌在俄罗斯、中国等国被用作为民间药物治疗糖尿病、心血管疾病和癌症历史悠久。但由于其自然资源的稀缺,运用人工技术扩大培养成为新的趋势。本论文比较研究了桦褐孔菌野生菌核和液体发酵三萜类化合物对α-葡萄糖苷酶抑制和α-淀粉酶的抑制作用和组成的差异,明确

学位

桦褐孔菌液体深层发酵三萜类化合物物质鉴定α-葡萄糖苷酶α-淀粉酶双向发酵

三维不可压Boussinesq方程恰当弱解奇异点集的Minkowski维数及其Hausdorff测度

本文主要研究三维不可压Boussinesq方程恰当弱解的部分正则性,用类似于Ladyzhenskaya给出Navier-Stokes方程恰当弱解在某点正则的充分性条件的方法,得出了 Boussinesq方程恰

学位

Boussinesq方程恰当弱解部分正则性Minkowski维数Hausdorff维数纲函数Hausdorff测度

运城市大气挥发性有机物特征及来源研究

挥发性有机物(Volatile Organic Compounds,VOCs)是一类非常重要的大气污染物。由于其对环境和人类健康有害,许多VOCs被美国(Environmental Protection Agency,EPA)归类为有害空气污染物。挥发性有机物与OH自由基、臭氧和氮氧化物(NOx)的反应会生成二次有机气溶胶(secondary organic aerosol,SOA)。VOCs在强

学位

挥发性有机物污染特征来源解析SOA生成潜势

基于高通量测序数据的新突变检测方法研究

随着测序技术的发展,人类获得基因组数据的成本正变得越来越低,速度也在不断加快,个人基因组时代已经到来。基因组数据的获取和存储已经不是问题,亟待解决的问题是如何从大量

学位

新突变高通量测序数据Adaboost可视化

CEV过程下带交易费的期权定价及其数值解法

Cox和Ross在 1995年对CEV(Constant Elasticity of Variance,不变弹性方差)过程进行了研究,提出了标的资产服从CEV过程的期权定价模型;Leland在1985年提出δ-hedging方法,可

学位

期权CEV过程交易费有限元法

CPU-GPU异构架构下共享内存管理策略的研究

其他学术论文