基于GPU的图计算研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:karrou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图算法一直是学术界和工业界的研究热点。随着社交网络和大数据爆炸式增长,基于大图数据的应用逐渐增多。Google提出了Pregel图计算系统,解决关于大图数据的分布式计算问题。Pregel编程模型为用户抽象分布式计算的实现细节,提供了简明的API实现图算法。随着GPU软硬件技术的发展,与CPU相比,GPU逐渐演变成为高度并行的多线程及多核处理器,同时具有强大的计算能力和超高的内存带宽。越来越多的图算法使用GPU来提升计算性能,并利用GPU的硬件特性优化图算法。但是目前大部分基于GPU的图计算研究都是针对特定的图算法,缺乏基于GPU的类Pregel系统,为图算法提供基于GPU的通用图计算系统。而且当前的系统尚未根据图算法特点和GPU硬件特性,对系统性能进行优化。因此,本文主要对基于GPU的图计算进行研究,以实现对基于GPU的Pregel编程模型进行改进,分析图计算出现的性能瓶颈问题,提出相关的系统级优化算法。基于以上研究成果,本文实现了基于GPU的图计算系统Pregel GPU。论文的主要工作如下:首先,讨论GPU体系结构的基础知识,归纳图计算的研究进展。着重阐述图计算系统的编程模型和执行流程,并分析相关系统的不足。其次,GPU线程具有细粒度并行的特点,改进传统的顶点编程模型,提出基于GPU的通用图编程模型—Edge-Vertex编程模型,为图算法提供类似Pregel的API。同时根据Edge-Vertex编程模型,设计图系统的执行流程,把整个系统执行阶段划分成预处理阶段、Edge Compute和Vertex Compute,并阐述各个阶段的执行任务和逻辑操作。最后,分析Edge-Vertex编程模型的性能瓶颈,提出相应的解决方案。由于基于GPU的图计算存在线程负载不均衡问题,提出基于GPU的近似排序算法,缓解线程任务分配不均衡的压力。根据GPU合并访问全局内存的特性,提出应用于消息缓存的数据重映射算法,减少非合并访存次数,提高全局内存的实际带宽利用率。实验显示在不同的数据集和图算法下,和其他基于GPU的图计算系统相比,本文实现的图计算系统可以达到1.6x—4.5x倍的加速比。
其他文献
随着计算机技术日新月异,许多电子商务交易应用需要在多种平台之间移植,并且需要可靠、高效的数据传输。交易中间件的出现屏蔽了异构系统中复杂的操作系统和网络协议,但随着
近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。数据挖掘被定义为从大量数据中提取或“挖
学位
招生工作是组织考试的首要环节,近年来,随着社会考试项目的不断发展,报名人数逐年增长,社会考试考务管理工作越来越繁重。社会考试报名组织工作需要考试部门和考生双方共同参
图像分割是医学图像处理中的关键技术之一,也是三维重建、定量分析等后续操作的基础,分割的效果直接影响到三维重建的速度和重建后模型的视觉效果。然而,由于医学图像本身的模糊
近年来,以BitTorrent和eMule为代表的P2P文件共享技术在应用领域获得了很大的成功;另一方面,传统流媒体系统的服务能力越来越不能满足需求。于是应用P2P模式解决流媒体服务系
随着网络技术以及数字通讯技术的迅速发展,工业自动化领域发生了巨大的变化,逐渐形成了自动化领域的开放系统和互联的通讯网络。在分布式控制系统中,软件技术是一个重要的组
20世纪80年代以来,世界各发达国家虽然已经基本建成了四通八达的现代化国家道路网,但随着社会经济的发展,路网通过能力已满足不了交通量增长的需要,交通拥挤和堵塞现象日趋严
ZigBee是一种新兴的近距离、低复杂度、低功耗、低数据速率、低成本的无线网络技术,它在家用系统控制、楼宇自动化、工业监控等诸多领域都具有广阔的市场空间。相比之下,蓝牙、WLAN、GSM等无线通讯技术,由于协议复杂、成本高、耗电量大等原因,在上述应用领域中的推广和应用都有一定的困难。ZigBee有自己的一套基于IEEE 802.15.4的无线电标准,它有一个显著特点就是在一个ZigBee无线网络中
图像分割是计算机视觉的预处理部分,在人工智能领域占有非常重要的地位。分水岭算法是快速有效的图像分割算法,但它有一个内在的缺陷,用纯粹的分水岭算法来进行图像分割的结
随着Internet的飞速发展,网络信息安全日益受到业界的关注和重视,防火墙作为普遍使用的网络信息安全技术成为研究的热点。Linux下基于Netfilter/iptables架构的防火墙具有很多