基于部分页迁移的CPU-GPU高效通信机制研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:guokm01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于GPU在复杂的科学计算上的出众表现,CPU-GPU异构系统逐渐成为了科学计算的重要工具。目前,CPU-GPU异构系统通常使用PCI-E协议连接,相对于CPU和GPU访问本地内存的高带宽,在CPU和GPU间提供数据通路的PCI-E具有低带宽高延迟的特点。然而,GPU上的计算应用通常需要较大的数据吞吐量,在这种情况下,数据通信的效率对整个CPU-GPU异构系统的性能有着显著的影响。随着内存管理方式从独立内存、统一地址空间变化到目前的统一内存方式,CPU和GPU之间的数据通信机制也在不断发展,由最初的程序员显式控制通信逐渐过渡到了通过页面迁移机制根据程序的数据需求在CPU和GPU之间自动地迁移页面。在高性能工作负载上,小页面会带来较高的地址转换开销,因此近年来CPU-GPU异构系统中的页面大小出现了增大的趋势。然而,由于CPU-GPU之间的低带宽和高延迟互连的限制,页面较大时迁移延迟也会随之增大,导致GPU上的计算为了等待数据而出现阻塞,进而造成严重的性能下降。本文针对以上问题进行了研究,主要工作如下:(1)本文对CPU-GPU异构系统中整页迁移机制引入的地址转换开销和迁移延迟进行了分析,并提出了一种透明的部分页迁移机制。该部分页迁移机制可以根据需要自动迁移页面的被请求部分,并在不修改程序代码和运行时库的情况下应用,以同时限制地址转换开销和迁移延迟。(2)本文定义了新的“部分有效”页面状态,在TLB和页表项中添加了已迁移范围的记录,提出了两种已迁移范围管理策略,对地址转换操作进行了修改,以支持新的部分页迁移通信机制。同时,本文评估了部分页迁移机制中页面大小和迁移单元大小对性能的影响。(3)本文提出了新的部分页面迁移操作,拓展了 GPU内存管理单元的功能,使它可以在生成迁移请求时指定迁移范围并进行请求合并,以支持新的部分页迁移通信机制。同时,本文在GPU内存管理单元中添加了预迁移的优化功能,用来和当前整页迁移机制上的预迁移优化效果进行对比。实验表明,当页面大小为2MB且PCI-E带宽为16GB/秒时,部分页面迁移可以在很大程度上隐藏整页迁移的性能开销。与完整页迁移机制相比,本文提出的部分页迁移机制实现了约94倍的加速。
其他文献
纤维素中的多聚戊糖成分进行酸处理后可以得到糠醛,然后由糠醛衍生得到的2-甲基呋喃具有优良的燃烧性能且可作为汽油添加剂。在本论文中,我们报导了在完全无外源气氛条件下,
机载外辐射源雷达作为一种重要的被动雷达,具有成本低、隐蔽性好、抗干扰能力强等优点,对提升我方军事防御系统探测性能具有重要意义。但机载平台的移动使探测环境的地海杂波
信息超材料天线是一种全新的天线体制,它通过编码调控各个阵元的特性以实现对电磁波的实时调控,从而可以实现对目标的实时探测与分析。相比传统的相控阵天线,这种新体制的天
目前GPU因其强大的计算能力已经被广泛地应用到通用计算领域中,为了有效地管理和执行众多的线程,它采用了SIMT的执行模型。然而,这种模型可能会使程序的执行产生非一致的控制
本文的研究内容来源于国家自然科学基金项目“LED光源光谱/色温对隧道各段照明的适用性研究”。隧道安全在高速公路的发展中越来越重要。LED因为使用寿命长、光衰比较小、发
石墨烯是碳原子由sp2杂化构成的二维纳米片层,具有优异的物理化学性能、超大比表面积和表面易改性的特性,在环境领域具有巨大的应用前景,是一种超强的吸附材料,可实现水体中
随着我国资本市场的不断发展,如何解决大股东与中小股东之间的第二类代理问题成为公司治理领域备受关注的问题。由于大股东掏空方式复杂且隐秘,导致投资者很难发现其中问题,
手性是存在于自然界的普遍现象之一,与大自然的许多生命现象有着千丝万缕的联系。而手性药物因其具有特殊的药理活性受到越来越多的科研工作者的关注。因此对手性药物的研究
合成孔径雷达(Synthetic Aperture Radar,SAR)因为具备全天时、全天候的优势,成为敌方目标监视和现代战场侦察的重要手段。传统的SAR解译依赖于人工判读,不能满足战场实时性
视频放大器是机载平视系统中的关键器件,可实现对视频信号的对比度、增益和亮度进行调节。目前我国视频放大器主要依赖于进口,由于中美贸易摩擦因素,导致航空机载领域核心器