CUDA平台上的CPU/GPU异步计算模式

被引量 : 0次 | 上传用户:AllFree
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算统一设备架构(CUDA, Compute Unified Device Architecture)开启了使用GPU强大计算能力做通用计算的大门,使得开发者能够在友好的开发环境中充分挖掘GPU的计算能力,同时也对CPU/GPU高效的合作计算模式提出了新的要求。一方面,在处理大规模并行数据时,需要保证GPU上各线程间的负载能够平衡;另一方面,在使用GPU进行计算时,需要保持较高的CPU和GPU利用率。本文分析了CUDA平台上CPU/GPU同步计算模式的优缺点;提出了CPU/GPU异步计算模式,此模式能够在处理有效计算量分布不平衡的大规模并行数据的应用中发挥较好作用;最后使用生物信息学中的应用HMMER,对比评测了两种计算模式。该研究对CUDA平台上面向应用设计合适的CPU/GPU高效合作计算方法具有一定指导意义。本文主要研究成果包括:(1)为有效管理有效计算量分布不平衡的大规模并行数据设计了通用数据结构,包括主数据管理结构和辅助数据管理结构,以有效计算工作量为核心,将类似数据统一管理并提交给GPU上各线程,从而保证线程间负载平衡。(2)针对CPU和GPU做同步计算时,CPU需要等待GPU完成计算,导致CPU计算资源浪费问题,提出了异步计算模式,设计了CPU上的线程划分方式,包含数据读入线程、计算线程、主控GPU线程。通过多线程设计,使得CPU无需等待GPU就能够利用本身的计算能力处理数据,从而加快整个程序的运行。(3)以生物信息学应用HMMER为例,分别应用CPU/GPU同步和异步计算模式,评测了性能上的改变,同时讨论了有效计算量区间设计、线程间通信方式、数据生产消费速度、数据转移方式等对异步计算模式性能的影响。
其他文献
<正>在我国22个人口较少民族中,赫哲族的经济社会发展速度是比较快的。2000年,黑龙江省同江市街津口赫哲族乡、八岔赫哲族乡、饶河县四排赫哲族乡的农村社会总产值为4235万元
会议
近年来,非英语专业学生的综合英语水平虽然有所提高,但是口语流利度的水平依然不够理想。究其原因,虽然存在来自于学习动机、个人素质、学习能力或教学方法方面的影响因素,然
话语的人际意义指的是语言除了传递信息之外还有表达说话者身份、地位、态度、动机等功能。人际意义是语言的参与功能,说话者通过这一功能使自己参与到某一情景语境中,来表达
G20的演变历程反映了国际政治经济呈现出的多样化要求,表明任何单个的国家或地区已经不能支撑起国际经济秩序。通过G20协调机制,能更好地实现各经济体利益的最大化。研究G20
在知识经济时代,人力资源是认为是企业的第一资源,企业的竞争归根到底是人才的竞争。作为现代人力资源管理实践之一的招聘工作,在人力资源管理中有着及其重要的战略地位,它是
通过对元、明两代里制与尺度及步长的实证研究,对明北京宫城内所遗存的若干元代风格的建筑遗存尺度的实证研究,对诸多史料记载的其它建筑与明北京宫城的相对空间的实证研究,
从电动汽车对驱动电机的要求,选取电机磁路结构、主要参数的确定等方面介绍永磁同步电动机的设计方法,通过有限元仿真分析验证该工程设计方案的可行性。
解析新能源电动汽车用驱动电机的要求及主要性能参数;对新能源汽车目前所采用的各种类型驱动电机一一作了简述;分析各类驱动电机的结构特点、应用范围及优缺点。
身体写作是20世纪90年代中后期出现的一种文学现象和文化思潮。它的产生曾引起学界的广泛关注。大部分研究者多从道德和价值方面对身体写作进行批判,特别是深受消费文化语境
拉丁舞是近10年来才在我国新兴起来的一项深受大众喜受,融体育与艺术、集健身与娱乐于一体的体育运动项目。它包涵音乐、舞蹈、服装、风度、形体美、气质等各个要素,兼有文艺