面向GPU/CPU异构系统的数据流任务划分与调度

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:kuaiyu001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异构计算机结合了GPU的强大并行能力和CPU的逻辑处理能力,在商业和科研领域被广泛使用。但要充分发挥异构计算机的性能,需要对硬件资源进行合理的调配。COStream作为一种数据流编程语言具有通信和计算分离的特点,在传统多核CPU上有良好的并行效果,但面对异构系统的复杂环境,其也面临着设备间负载不均衡、通信开销过大等问题。为了充分发挥异构系统的优势,以COStream数据流编程语言为研究对象,设计了面向GPU/CPU异构系统的数据流任务划分算法和优化方案,包括异构负载均衡划分算法、设备间通信节点优化和NDrange(N-Dimension range)优化。异构负载均衡划分算法分为设备间数据流任务初步划分、负载预估与负载调整、设备内任务划分三个步骤,结合数据流图的并行特性对数据流任务进行层层划分。该算法具有两大优势:充分挖掘数据流程序的并行特性,将计算节点按照其特性划分到最适合的计算设备,发挥各计算设备优势;预估并调整了设备间的负载情况,在考虑通信开销的同时使各设备之间负载尽量均衡,提高软件流水线性能。针对异构设备间通信开销大这一问题,设备间通信节点优化将通信任务从GPU计算节点独立,以空间换取时间的方式利用软件流水线将通信开销隐藏于计算之中。NDrange优化算法针对不同规模的计算节点(actor)对NDrange分配进行自动优化,使转化后的kernel能充分利用GPU硬件资源,提高程序的执行效率。实验采用搭载多核CPU和NVIDIA GPU的异构计算机作为实验平台,选取了6个多媒体领域的典型算法,以不同的数据规模从多方面测试异构负载均衡划分算法和优化方案的有效性。实验结果表明,异构负载均衡划分算法、设备间通信节点优化和NDrange优化均取得了良好的效果。
其他文献
人类社会发展至今日,未成年人身心趋向早熟,但是他们实施的严重危害社会的行为并没有按其心理状态情况,承担起相应的刑事责任。近年来,怎样应对我国未成年人实施的极端暴力性行为,正在被越来越多的民众所关注。我国法律目前只有刑事诉讼法中单个章节设置的未成年人诉讼程序,其他法律的规定都比较分散,并且主要侧重于未成年人保护,因此在立法上无法对未成年人实施的严重危害社会的行为进行有效规制。我国刑法规定不满14周岁
母婴护理知识对准妈咪和新手妈咪来说,最重要的事情就是宝宝和自身的健康问题,对于母婴知识有无限求知欲望的妈妈们,这些极其重要的知识你们千万不要错过哟!接下来我们一起来看
陆定一是我国卓越的新闻战线领导人,毕生从事中国共产党的新闻宣传工作,自青年时期开始就接触报纸编辑工作,曾主编过多份报纸杂志,发表了多篇新闻、通讯、评论和理论文章,具
目的:透明质酸是天然存在于人体内的一种粘多糖,由β-D-葡萄糖醛酸(GlcA)和β-N-乙酰氨基葡萄糖(GlcNAc)两种单糖以交替的β-(1→4)和β-(1→3)糖苷键连接形成。存在于皮肤中
学术评价的两种方法——定性评价与定量评价各有其利弊。当前中国学术评价的主要弊端有:浓厚的行政主导色彩;量化评价的过分使用;同行评议的公信力受疑。为解决这些弊端,"核心
城市景观亮化工程,是指在标志建筑、景点、商场和街道等地方安装灯具,以照明来美化城市环境,提高城市的整体形象的工程项目。中国从古自今都有观赏灯景的风俗习惯,元宵节全国