GPU体系结构模拟器的实现与优化

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:leeannie222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模拟器是体系结构研究和设计的重要工具,在学术界和工业界得到广泛使用。软件全系统模拟器具有开发速度快、成本低、易于修改等特点,因此在计算机系统设计、验证,系统软件开发、调优等方面都可以发挥重要作用。然而,由于开发计算机体系结构软件模拟器通常十分困难,模拟器运行程序的时间很长以及模拟结果精度差等问题,限制了体系结构软件模拟技术在计算机系统设计中的有效性。许多研究人员已经提出了各种各样的方法和技术来解决这些问题,但是,到目前为止,这些问题还并未得到根本性解决。近年来,GPU得到了高速的发展,GPU非常适合于高效率低成本的高性能并行数值计算。而GPGPU是一种处理图形任务的专业图形处理器,具有强大的并行处理能力和可编程流水线。特别是在面对SIMD且数据处理的运算量远大于数据调度和传输的需要时,通用图形处理器在性能上大大超越了传统的CPU。另一方面,CPU由于受摩尔定律的限制,采用提高CPU制程和主频的办法遇到了工艺上的瓶颈,暂时无法突破;而从1993年开始,GPU的性能以每年2.8倍的速度增长。所以对于GPU的研究在当前学术界非常的热门,但是NVIDIA(英伟达公司)并没有公开其源代码且主流GPU模拟器更新换代较慢,导致对这方面的研究比较困难。当前学术界主流的GPU模拟器GPGPU-SIM是由UBC开发于2010年,因为其性能良好,且实验数据和物理GPU结果高度一致(矫正后数据一致性可达98%以上)被学术界广泛采用。但是其缺陷也非常明显,(1):不支持多任务抢占式操作,(2):代码陈旧且不适用于灵活多变的应用场景。本文所作的工作是自底向上的搭建了一个新的GPU模拟器即Z-GPU-Simulatoir,利用该模拟器来测试对GPU体系结构进行优化后的效果,主要工作包括以下四个部分:1:简易调试器Z-GDB的实现,该调试器能够打印寄存器状态,扫描内存,实现复杂表达式的求值。2:内存模块的实现,该步骤对内存进行模拟并且实现访问内存的读写操作,同时给予GPU以返回。3:片上网络模块的实现,构建了整个模拟器的片上网络同时模拟了信息在网络上交互的过程。4:验证了一种新的GPU作业调度策略,该设计方法参考IBM Blue Gene系列机器核间通信策略,扩展了 Cache访问之间的局部性原理,提高了核间通信机制的效率,同时对粗粒度任务调度进行了优化。
其他文献
广义的公司治理结构包括内部治理结构、外部治理结构和公司治理法律环境三个方面内容。通过这三个方面分析我国上市公司治理结构,我们发现,我国上市公司治理结构呈现“一股独大
新课程标准的数学教育观点认为,初中数学教学是数学活动的教学,即数学思维活动的教学。如何在初级中学数学教学中培养学生的思维能力,养成良好思维品质是教学改革的一个重要
EEMD算法可以很好地应用于非线性、非平稳信号分析,但添加白噪声标准差σ与总体平均次数N需要根据经验人为选取。本文通过仿真实验的方法确定了σ与N的自适应选取准则,并使用自
将BCL11B基因插入pIRES—EGFP构建重组质粒真核表达载体pIRES—EGFP—BCL11B,采用电转染法将重组质粒转入人幼稚T细胞,转染24h后,用原子力显微镜(AFM)观察转染前后细胞的表面形态
目的探讨Sysmex CS5100与Sysmex CA1500全自动凝血分析仪检测凝血酶原时间(PT)、活化部分凝血活酶时间(APTT)、凝血酶时间(TT)、纤维蛋白原(FIB)的结果是否具有可比性。方法连续30d进
中国共产党对中国法治建设的领导是历史逻辑、理论逻辑和实践逻辑的统一。坚持党的领导、坚持走中国特色社会主义法治道路、坚持“实事求是、与时俱进”的思想路线,既是党领
许多人认为定期锻炼的唯一原因是它有助于保持健康的体重,这是不正确的。《美国心脏病学杂志》于2018年12月在线发表的一项研究表明,久坐的生活方式可能会抵消控制体重对心脏
目的基于网络药理学探讨黄芪-山药药对治疗2型糖尿病的作用机制。方法通过中药系统药理学数据库和分析平台(TCMSP)检索黄芪山药药对中药物成分,并以口服生物利用度(OB)值≥30
《普通高等学校本科专业目录》中管理学一级学科之下的工商管理类二级学科之下的工商管理专业是老牌专业,一直以来以培养“综合型管理人才”或“企业中高层管理者(也称为经理
本文以红外辐射法显现纸张表面汗潜手印原理为基础,结合电烤箱的结构和工作原理,实验研究了用“美的T1-L101B电烤箱”作为红外辐射源显现纸张表面汗潜手印的可行性及最佳辐射条