通用多核集群上的并行调优策略研究

被引量 : 6次 | 上传用户：shyan

【摘要】

：

随着高性能计算进入多核时代,通用多核集群已逐步成为当前大规模并行计算的主流平台。这类集群系统以多路通用多核服务器(Multi-Socket Multicore Server)为基本计算节点,节

【作者】

：

王鹏

【发表日期】

：

2011年01期

【关键词】

：

自优化静态分析微测试程序数据划分负载均衡

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着高性能计算进入多核时代,通用多核集群已逐步成为当前大规模并行计算的主流平台。这类集群系统以多路通用多核服务器(Multi-Socket Multicore Server)为基本计算节点,节点间采用Infiniband等高速网络互联。通用多核集群的兴起带来了并行调优方面的深刻转变和挑战,主要表现为这类集群上的并行编程和调优环境还不成熟,与硬件之间存在巨大鸿沟,目前这类系统上的并行程序调优工作主要依靠程序员手工完成。一个极具现实意义的问题是,给定一个应用程序和目标集群,应遵循怎样的流程来优化并行程序以尽量发挥系统性能?解决这一问题的技术统称为并行调优策略,该技术定义了一套系统化的分析、理解和优化并行程序的方法。目前,面向应用的以大规模通用多核集群为目标平台的并行调优策略的研究刚刚起步,本文即是这个方向的一次尝试。本文针对当前主流并行调优技术的不足,以科学计算中最常见的FMM和Stencil计算为目标,提出一种能够用于指导在通用多核集群上对应用程序进行并行调优的新策略。该策略首先将影响程序性能的主要因素分为计算、访存、通讯和负载均衡(分别简称为P、M、C、B)四个主要类别,不同程序的PMCB的特性是不一样,需要区别对待。FMM类程序的主要性能特征都能手工精确计算,对于这类程序我们提出一套基于静态分析的优化策略,收到了很好的效果。Stencil计算中计算优化相对独立,可以独立确定,访存和通讯则相互影响,其中一部分访存优化可以通过静态分析决定如何选择优化参数,剩下的访存优化和通讯优化相互影响不易确定,为了确定这部分优化组合,我们开发了访存和通讯微测试程序来模拟Stencil计算中常见的访存和通讯模式,通过微测试程序可以有效比对不同访存和通讯的优化组合之间的相对优劣。由于避免了直接运行程序带来的高开销,新策略只需要自优化10%的时间就能达到自优化95%的效果。Stencil计算中的Line-Sweep计算具有特殊的访存和通讯特征,简单的负载均衡策略(保证各计算节点的计算、访存和通讯量一致)并不能保证性能最优。这是因为简单的负载均衡策略在某些情况下会导致访存量和通讯量过多。为了解决这一缺陷,本文提出均衡数据划分,进一步放松对数据分割和处理器分配的非本质约束,以利于在计算、访存和通讯这三种开销之间达到最佳平衡。文中给出生成最佳均衡数据划分的算法,它包含3个关键技术：首先建立性能模型,在该模型中均衡数据划分的性能只与数据分割方式有关；接着基于该模型缩减数据分割方式的搜索空间,并以该模型为判据搜索性能最佳的数据分割方式；最后设计处理机分配函数以满足均衡数据划分的条件。我们将均衡数据划分应用于APPBT和APPSP程序。实验结果表明,当均衡数据划分与多重数据划分的数据分割方式相同时,二者性能基本一致：当两种数据分割方式不同时均衡数据划分效率远高于多重数据划分。从整体看,均衡数据划分的并行效率在不同计算节点数下的方差较小。

其他文献

汽车尾气与汽车故障的关系分析

搭载汽油发动机的汽车,尾气的主要有害成分为CO、HC和NOX,这些有害气体的排放量,取决于汽车发动机的运行工况及运行状态。因此,可以通过尾气的状态分析汽车的运行状态是否存

期刊

汽车尾气汽车故障关系

试论高校音乐鉴赏课的审美导向作用

随着当下新媒体与互联网终端的快速发展,信息传播呈现出极高的时效性。各色APP平台中的口水音乐、语言段子等表演野蛮生长。娱乐化、快餐化的特点,使得部分青年乱花迷眼而流

期刊

高等教育音乐鉴赏审美趣味导向作用

发动机氧传感器检测与分析

氧传感器作为减少排放污染,提高汽车燃油经济性能的设备,已广泛装配在安装三元催化剂的汽车上。如果燃烧室内可燃混合气燃烧不充分,废气中含有大量CO、HC和NOX有害气体,三元

期刊

氧传感器空燃比检测分析

民主政治视野下的我国基层政府体制改革研究

民主政治是社会主义的根本属性，是市场经济发展的本质需要，它具有保障人民的基本权利和维护政治稳定等方面的社会功能，内在地构成了实现当代中国社会主义的核心内容与关键条件。

学位

民主政治基层民主体制改革职能转变

两招治晕车:按耳穴、吃榨菜

<正>晕车,让你身体不适的同时,还会觉得很扫兴。那么怎么避免晕车呢?晕车原因人体靠前庭平衡器官维持身体平衡,晕车与它密切相关。当汽车启动、运行或刹车时,人的前庭会受到

期刊

植物神经功能紊乱

中国股市存在盈余公告后的价格漂移吗?

中国股票市场存在盈余公告后的价格漂移吗?已有研究的结论是否受制于定价模型的错误设定?使用三因子模型估计股票在盈余公告后的预期收益并计算盈余公告后的价格漂移,研究发

期刊

盈余公告后的价格漂移股票市场事件研究三因子模型非平衡面板数据

海湾扇贝裙边糖蛋白的抗肿瘤及免疫调节活性研究

为了研究扇贝糖蛋白(AIG)的抗肿瘤活性及对机体免疫功能的影响,本研究选用昆明种小鼠为实验动物,通过移植性肿瘤动物模型,研究不同剂量的AIG对肉瘤-180(S180)生长的抑制作用,

学位

扇贝糖蛋白S180淋巴细胞凋亡T淋巴细胞亚群溶血空斑淋巴细胞转化

历史记忆、文化展示与民族认同——湘西苗族鼓舞象征意义与功能分析

鼓舞在湘西苗族人们心目中特别神圣。鼓舞不仅具有节庆、祭拜祖先、民俗仪式、文化活动、娱乐等表现功能,更具有历史记忆、文化自我展示和民族认同的象征意义。然而,鼓舞这一

期刊

湘西苗族鼓舞历史记忆认同保护

长双歧杆菌NCC2705果糖ABC转运系统的研究

双歧杆菌(Bifidobacterium,B. longum)是人体肠道内最重要的益生菌,具有改善营养、增强免疫、抗过敏、抗肿瘤、抗感染、抗衰老、调整肠道菌群平衡等诸多重要的生理功能。随着

学位

长双歧杆菌NCC2705(B. longum NCC2705)糖吸收与代谢BL0033/BL0034/BL0035/BL0036果糖ABC转运系统

长沙民政职业技术学院康复医学系学分制教学改革实证研究——以护理专业0731班为例

目的:以一个班级为样本,剖析学分制实施过程,以此总结经验,推进学院学分制改革;方法:利用学院教学管理系统采集数据、统计分析,并辅以文献调研和访谈等方法;结果:学院学分制

期刊

学分制选课制导师制教学改革

通用多核集群上的并行调优策略研究

其他学术论文