一种双分割结构的单机图计算系统研究与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:liushanxue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今图计算应用的领域非常广泛,如社交网络、物联网和神经网络等,常见的图计算系统分为单机图计算系统和分布式图计算系统。分布式图计算系统有负载不均衡、昂贵的通信开销以及弱健壮性等缺点,同时在大规模图的处理问题上,最近的研究结果表明单机图计算系统和分布式图计算系统具有同样高的竞争力。因此,单机图计算系统正成为图计算研究领域的重点。  GraphDse是一个基于外存的单机图计算系统,GraphDse图处理过程分为两个阶段:预处理阶段和更新阶段。在预处理阶段,GraphDse提出了基于目的顶点均匀分割的结构(Destination-Average Shard,DAS)和基于源顶点均匀分割的结构(Source-Average Shard,SAS)来存储图数据,保证了图数据的局部性和提高了CPU的运行效率。在更新阶段,GraphDse提出了双滑动边(Double Sliding Edges,DSE)的计算模型,避免了同步锁或者原子操作带来的系统开销,实现了很高的并行度。在迭代过程中将顶点存储在内存中,减少了在外存上对图顶点的读写操作,减少了大量的I/O数量。针对不同类的图应用提出了灵活的选择调度策略,可以跳过一条边的计算甚至一个分片的加载和计算,减少了I/O数量和提高了图算法收敛速度。  在真实世界的自然图数据和合成的图数据上运行图应用(PageRank、BFS和WCC)来进行大量的实验。和目前主流的图计算系统GridGraph相比,实验证明GraphDse可以显著地提高性能。在预处理阶段,GraphDse性能最高提升了60.1%。在更新阶段,对于PageRank应用,GraphDse系统性能最高提升了83.0%;对于BFS应用,GraphDse系统性能最高提升了44.4%;对于WCC应用,GraphDse系统性能最高提升了86.6%。
其他文献
分形理论是近些年来发展起来的一门新学科,主要用来描述自然界和非线性系统中不光滑和不规则的几何形体。植物作为自然界的重要组成部分,与人类的生存、发展息息相关。种类繁
语音识别的研究对象是语音,研究目的是让机器能够识别人类语音,研究内容是如何让机器在各种环境下从语音信号中提取语音信息,从而使机器能够有效地理解和执行发声者的各种意
随着无线传输技术、多媒体技术以及移动终端技术的持续发展,移动终端用户对多媒体视频的需求越来越迫切。但由于无线网络带宽的限制以及移动终端设备本身的性能限制,移动终端
数据库技术是计算机科学技术中发展最快的领域之一,也是应用最广的技术之一,它已成为计算机信息技术与应用系统的核心技术和重点基础。现如今,传统关系型数据库已经得到了广
Internet的飞速发展,使传统结构的计算机网络应用系统正在逐步被基于B/S三层结构的应用系统所代替。本研究课题是结合现代高职教学的特点,根据教学需求,提出了基于B/S模式的高职
现在,业界已广泛地使用SOA(Service-oriented architecture,面向服务架构),同时SOA也研究领域的一个热门话题。在构建一个高质量的面向服务解决方案时,以适当的粒度识别出架
因特网技术的发展和广泛应用,使得以各种形式存在的数据资源迅速膨胀。而这些数据资源往往分布于不同的网络环境,且采用不同的数据存储标准、存储格式和访问方法,这就造成了