面向众核体系结构的图算法并行优化技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:duzhiwei1010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
跨入新时代,计算机融入到人们生活的方方面面,随之也产生了数量巨大的数据需要处理。云计算、物联网、物理学、生物学、环境生态学等领域更需要对海量数据进行挖掘和处理,这预示着我们进入了“大数据”时代。“大数据”时代处理的数据量非常大,数据种类繁多,对数据处理提出了新的挑战。图提供了非结构化数据的自然表现,是大数据的一种非常有效的表示方法。图的遍历是一种基础的图形算法在社交网络、商业分析、高性能计算等领域有广泛应用的图形算法。在单节点上图的遍历已经被研究和优化的非常完善。目前异构计算正变得越来越流行,而CPU+MIC是一种典型的异构体系结构。Intel的MIC(Many Integrated Core)是一种为高并行计算设计的众核协处理器,它拥有大约60个核心。在图的遍历方面,MIC还没有被很好的利用起来。同时图具有:小世界性、无标度性、社区结构等属性。即一部分顶点的度较小,另一部分顶点的度非常大。因此当用MIC来遍历图形时,划分到MIC各个核心的顶点的度差别会很大。经量化分析证明MIC处理并行图算法存在很严重的负载不平衡现象,这会对系统的性能造成不利影响。本文将提出一种算法设计和优化技术来改善MIC上的负载不平衡现象。关于这一优化设计,它的核心思想是将度高的点和度低的点区分处理。为了实现这一思想,本文还提出一种改进的数据结构,以达到将胖节点和瘦节点区分处理的目的。通过这些优化措施,相较于未经优化的算法优化算法获得了非常高的性能提升。同时我们相信这一新颖的算法将会得到广泛的应用,特别是对拥有多个MIC的大规模并行系统中。本文主要包括以下几个方面的研究工作:(1)MIC是一种超多核心架构的处理器,在处理并行图算法时存在严重的负载不均衡现象。针对这一负载不均衡现象,本文做了深入的量化分析。首先在单一节点上采用方向优化的策略在MIC上实现并行BFS算法,统计出规模是20每次BFS第三层的最大边差(处理边数最多的核的边数减去处理边数最少的核的边数)和最大边差比(处理边数最多的核的边数减去处理边数最少的核的边数除以每个核处理的平均边数)。通过对这两个参数的分析,量化地分析了MIC处理并行图算法的负载不均衡现象。(2)本文主要研究如何减轻MIC上各核处理并行BFS时的负载不均衡现象。图形顶点度的差异是造成MIC负载不均衡的关键因素,因此对MIC的优化的关键是将胖节点和瘦节点区分出来处理。即选择图中度大的若干顶点组成胖节点集合,剩下的度小的顶点组成瘦节点集合。然后将胖节点均匀的分配到MIC的各个核,进行并行宽度优先搜索。再将瘦节点均匀的分配到MIC的各个核,进行并行宽度优先搜索。在进行宽度优先搜索时,采用双向搜索的优化策略。即在对胖节点和瘦节点分别进行并行BFS处理的同时,对算法进行双向搜索的优化,算法性能取得了很大提升。(3)同时本文设计算法将单节点的优化方法推广到大规模并行系统上。设计采用一维和二维的图划分方法,节点间的划分方式不变,对每个节点内的MIC运用上述方法进行负载均衡优化。通过提高每个MIC的性能,提高整个系统的性能。同时采用waves通信、位图、计算和通信重叠等优化技术对算法进行优化。
其他文献
随着计算机与网络技术的普及应用,信息安全已经成为关系到国家安全的关键因素。操作系统是整个信息系统安全的基础,如果不经过安全测评,操作系统的安全性就得不到保障。而且
本体最初是一个哲学概念,用来描述事物的本质。在本世纪80年代,科研人员把本体引入人工智能领域,并赋予其新的含义。在计算机科学领域,本体被定义为共享概念模型的形式化规范
科学与工程应用对计算性能要求的不断增加使得机群系统得到了迅速发展,但由于功耗和散热等因素,基于CPU的同构机群系统可拓展性已成为发展瓶颈。而图形处理单元(GPU)、众核协
随着信息技术在新药创制中的不断成功应用,以多样性分析为基础的计算机药物虚拟筛选成为当前新药研究中克服化合物数目不足对新药创制的制约的重要技术手段,基于结构的分子对
随着布料模拟技术在计算机动画、纺织服装CAD和虚拟试衣系统中的广泛应用,模拟效率的要求日益提高。而布料模拟系统中的碰撞检测部分的检测速度正是模拟效率的重大瓶颈。因此,
近年来,随着计算机网络技术的发展,网络数据库的应用日益广泛,网络数据库系统的安全问题也由此引起人们的普遍关注,如何保证网络数据库中数据的安全性,己成为一个迫切需要解
字符识别是模式识别领域的重要研究方向。目前,其主要的研究方法大都是基于统计学的,研究者需要搜集大量的标记样本进行训练,然后生成分类器进行分类,这样耗费大量的时间与人
随着经济的快速发展,公路车辆数目不断增多,道路交通安全成为社会关注的普遍问题。在这种情况下,我国陆续投入各种智能交通系统的研究,而交通标志作为向行人指示交通的交通设施对
语义Web的目标是使得Web上的信息具有计算机可以理解的语义,随着语义Web中本体数量的不断增加,本体的重用和共享逐渐成为亟待解决的重要问题。在不同本体间进行映射是解决本
在以数字化信息为资源、互联网交互为动脉的21世纪,快速、有效地获取有用信息变得越来越困难,其根本原因在于现有数据缺乏语义信息。针对这种情况,在语义和知识层面上描述领