UniCore-3处理器指令动态调度机制设计与性能评测

来源 :北京大学 | 被引量 : 0次 | 上传用户:slovedw520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
处理器性能一直是处理器设计的主要目标。如何充分开发和利用指令间的并行是提升单核处理器性能的关键。超标量技术是现代处理器设计中广泛使用的技术,它通过多发射、动态调度等技术开发指令间的并行。指令动态调度技术属于指令调度技术的一种,不同于静态调度,其利用运行时的动态信息来帮助发现可并发成分。动态调度技术通过寄存器重命名、乱序发射等多种机制发现可并行的指令并让其更早地得到执行,从而达到提升处理器性能的目的。  本文基于北京大学微处理器研发中心正在研发的UniCore-3处理器,通过调研和分析,设计实现UniCore-3处理器的指令动态调度机制,并完成功能验证。在此基础上,通过性能评测分析瓶颈并进行优化。本文完成的主要工作如下:  1.调研超标量处理器设计技术及指令调度相关技术。分析超标量处理器中的指令序关系。以寄存器堆的组织形式和重命名映射表结构的选择两个维度描述重命名机制的设计空间。比较了数据捕获及非数据捕获两种指令调度窗口。调研分析主流处理器相关功能的设计实现。根据UniCore-3处理器的需求分析确定实现方案及各结构规格;  2.根据需求分析,确定实现使用混合式寄存器堆,随机访问存储结构重命名映射表的重命名机制,以及使用转移发射队列、通用发射队列和浮点发射队列和保留站结合的两级数据捕获指令调度窗口。完成硬件描述编码,从模块级及汇编级两个层次完成对设计的功能验证,编写或生成测试向量131510个,各模块的功能覆盖率达到100%,同时代码的各项覆盖率也都达到100%;  3.基于现场可编程门阵列原型(FPGA)环境,利用Dhrystone程序及SPECCPU2000测试集展开对指令动态调度机制的性能评测,分析影响性能的瓶颈,提出两个性能优化方案,分别编码实现并通过回归测试。在优化方案上的性能评测证明提出的优化方案对处理器性能有2%左右的提高。
其他文献
人体姿态估计是对图像中人体特征点位置的检测,目前已经成为计算机视觉领域的重要研究方向之一,且应用十分广泛。人体姿态估计的研究奠定了人体运动分析、人机交互、模式识别和
随着集成电路制造工艺的迅速发展与应用需求的不断提高,多核处理器是目前微处理器发展的主流方向。在基于共享存储的多核处理器系统中,当多个处理器核对同一存储位置访问时,
手势识别在人机交互、聋哑人教学、虚拟现实、智能家居等领域中有着重要的应用前景。目前根据获取手势数据的方法不同,可以将其分为两个不同的方向,一是基于数据手套的,另一个是
Web应用系统已成为当前的主流网络应用,为用户提供电子商务、电子邮件、在线新闻、网络社区等类型多样的服务。Web应用具有异构性、分布性、动态性等特征,当前Web应用呈现出规
无线射频识别(RFID)技术利用无线射频信号实现非接触式自动识别,具有快速、可靠、准确及抗干扰能力强等优点,广泛应用于商品识别、公共交通、物流追踪、军事反恐、数字图书馆管
对计算机系统性能的追求是无止境的。计算机系统的性能与编译器等系统软件密切相关。编译器生成的指令类型、数量和排列都会影响计算机系统的性能。随着处理器结构日趋复杂,编
Linux内核发展迅速,已经被应用于多个平台上,但同时对Linux内核的开发和维护提出了更高的要求。为了提高调试和剖视Linux内核的效率,节约时间成本,Linux内核跟踪工具应景而生。Ft
行人检测是车辆自动驾驶系统的核心模块,主要通过安装在汽车上的雷达、摄像头等设备获取道路状态信息,判断车辆行驶前方是否有行人,为车辆自动驾驶过程中报警、自动减速或者紧急
汽车主动安全是一种使汽车在事故可能发生时能够主动采取措施,避免事故发生的技术。盲点探测系统作为汽车主动安全系统的重要组成部分,在车辆进行并道或超车时,能有效降低因视觉
本论文的主要内容是视频图像质量检测技术的研究与实践。视频图像质量的评价方法有很多种,通常从清晰度、色偏、对比度和信噪比等几个方面来衡量,而对图像清晰度的检测是难点