CPU/GPU异构多核虚拟执行环境框架的设计与实现

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:usercmd1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,拥有着强大并行处理能力的GPU(Graphic Process Unit)得到了飞速的发展,从而也使得CPU/GPU的架构越来越流行。目前除了使用显式的编程方法比如NVIDIA提供的CUDA(Compute Unified Device Architecture)以及AMD的Stream SDK外,我们并无其它方式来挖掘GPU的并行处理能力。然而在使用显式编程的过程中我们也会碰到重写源代码的耗时问题跟二进制不兼容性问题。一方面,当前有着很多的计算型密集型程序是采用C、C++或其它高级编程语言编写,而这些应用如果想要使用GPU的并行处理能力来缩短程序的执行时间,那么采用显式编程的方式来修改或是重写整个源代码是不可避免的,而更为糟糕的是有些时候我们根本拿不到程序的源代码;另一方面,即使这些应用的源代码按要求被重写后也会产生二进制不兼容性问题:一个在显式编程环境下编译的可执行程序在不同厂商,哪怕是同一厂商的不同型号GPU上将无法或无法正常运行。为了解决重写源代码的耗时跟二进制不兼容性问题,本文的研究目的是通过扩展自主研发的多源多目标的动态二进制翻译系统Crossbit来提供一种虚拟执行环境,既能有效地解决重写源代码的问题,亦能自动地使用GPU的强大并行处理能力,最终使得部分的计算密集型应用获得5-8倍的性能提升。其原理是通过静态与动态的二进制分析技术从二进制文件中提取潜在的可并行代码,然后通过多面体模型分析将那些没有数据依赖的可并行代码并将其放到GPU上加速,最终将执行结果拷贝到主存的相应位置,而那些不可以放到GPU上执行的部分则采用正常的动态二进制翻译执行。由于计算密集型应用的大部分时间用于计算,因而GPU的加速性能使得这些应用的整体性能得到了很大的提升。本文的主要创新点和意义在于:1)提出一种适合于计算密集型应用的虚拟执行环境,有效地屏蔽了使用显式编程去重写源代码来使用GPU的问题;2)利用二进制分析技术与多面体模型提取二进制可执行程序中的可并行部分,为之后的GPU加载并执行这些可并行部分提供了准确的定位;3)通过挖掘GPU的强大并行处理能力,有效地提高了计算型密集型应用的性能。
其他文献
随着电力电子技术的发展,开关电源已经代替线性电源迅速普及到各个应用领域,高效、高功率密度、高频化、小型化是开关电源最大的优点,但电磁干扰也是开关电源带来的一个新问
语言是文化的载体,文化是语言滋生的土壤。汉英文化的差异导致两种语言中存在着大量词汇空缺现象。本文通过对比分析汉英语中的词汇空缺现象,透视两种语言所代表的东西方文化
信息化是制造现代化的一个重要部分,制药行业作为一种特殊的制造业,其信息化也需要满足制药行业特殊需求如质量优先、系统验证等。本文描述了云南白药和华北制药两家国内大型
<正>小组合作学习是新课改所倡导的重要学习方式,这是对传统教学方式的突破,实现了学生的主体参与,实现了学生由被动学习到主动构建的转变,更加重视学生参与探究活动的主体性
长势良好的豆瓣,日益引起各界人士的关注,还被图书馆界人士列为图书馆职业的十大敌人之一,面对豆瓣,图书馆该做出如何应对,采用合作的策略无疑是明智之举,本文对其合作的可行
对豆瓣网图书的大众标注进行调查和分析,在此基础上结合实例,将豆瓣网图书的大众标注与传统的主题标引进行比较,借此剖析大众标注的优点与存在的缺陷,并有针对性地提出一些规
建设京津冀一体化和首都经济圈要实现的战略目标就是要建设世界级规模的大都市圈、世界级的研发和创新创业基地、中国高端服务业和高端制造业的集聚区、中国北方的门户地区和
我国房地产市场起步比较晚,但是在过去的20多年成长迅速,发生了翻天覆地的变化。早期的房地产市场调研主要是了解项目周边楼盘的情况,以后逐渐演化到竞争环境的分析,即通过收
为建设资源节约、环境友好型大学校园,校园废物应回收利用。本文运用建设项目管理理论和系统分析方法,对大学校园废物的回收利用管理进行了理论和实证研究。1、对校园的废旧