基于寄存器重命名的DSP指令流水线的研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:AKDelphi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的不断发展,高性能处理器在日常生活以及军事领域中发挥着越来越重要的作用。在处理器的发展历程中,人们采用了多种方法提升处理器性能。但截至目前,最为广泛的方法还是提升指令级的并行性。指令间的相关性是影响指令级并行性的主要因素,包括数据相关、结构相关及控制相关。其中数据相关又可分为真数据相关和假数据相关。通过使用寄存器重命名技术能够简单有效地消除指令间的假数据相关关系,挖掘指令间潜在的并行性,使得流水线最大程度的保持一种“充满”的状态,最终达到提升微处理器性能的目的。本论文在研究超标量处理器的基础上,结合寄存器重命名机制的特点,对DSP的指令流水线进行了设计优化,使得指令级并行性得到提升,并能够有效的降低延时、面积和功耗。具体研究工作如下:一、寄存器重命名方案的设计。依据在研乱序超标量处理器的结构,使用统一的PRF进行寄存器重命名,并对寄存器重命名机制的主要模块进行详细讨论。利用重命名映射表及空闲列表,将重命名过程分为读取源寄存器、分配物理寄存器和更新重命名映射表三个部分。二、DSP指令流水线的优化。物理寄存器文件的大小和读写端口的数量决定了寄存器文件的访问时间。基于物理寄存器资源和重命名逻辑在管理和使用方面存在的不足,进行了优化设计。针对物理资源使用浪费的问题,本文设计了物理寄存器的重用技术,并将物理寄存器的分配推迟到指令结果真正占用时,减少了物理寄存器个数和无效占用时间。针对重命名映射表端口利用率不高的问题,降低RAT读端口数量并优化控制逻辑,改善重命名逻辑的面积和访问速度。三、DSP指令流水线的评价。在Simple Scalar模拟器下分别对简单程序和SPEC CPU 2000整数基准程序进行测试。然后分析实验数据并对处理器性能进行评估,确定最终的寄存器的重命名方案。使用Verilog HDL语言完成相关模块的设计,并利用Design Complier等工具进行综合,对比重命名机制改进前后的延时、功耗及面积。实验结果证明,在处理器的IPC损失不到5%的情况下,优化方案能够减少8.5%的延迟时间,39.8%的功耗和65.3%的面积。这就意味着此方案在减少的物理寄存器数量和降低重命名逻辑设计复杂度的同时可以取得更大频率和指令并行度,从而提高了处理器的性能。
其他文献
电力二次系统是保护电网安全的重要手段,但大量告警常常使管理员无从下手,自动处理告警并提取攻击是智能电网面临的重要问题。已有的安全事件分析技术大多针对互联网设计,不同的告警形式和可靠性需求都使其难以在电网中直接适用。除此之外,当前攻击预测研究大多针对流量数据进行,少量基于攻击链的研究也较简单,效果欠佳,可移植性不强。为此本文提出了电力二次系统多步攻击检测模型和分别基于自注意力和模型融合的攻击预测模型
退行性瓣膜疾病常发于老年犬,常发品种为博美、迷你贵宾、吉娃娃犬和北京犬等。主要临床症状表现为咳嗽,呼吸困难,喘息,甚至发生晕厥。听诊可发现不同级别的心杂音。目前对于
目的:本研究主要探究急性冠脉综合征患者血清GDF-15、YKL-40水平及颈动脉硬化与冠状动脉病变严重程度的关系。方法:选取2018年1月至2018年7月在承德医学院第二附属医院心内科明确诊断为急性冠脉综合征的患者62例作为急性冠脉综合征组(ACS组,n=62),其中再根据冠状动脉SYNTAXⅠ评分将ACS组分为冠状动脉SYNTAXⅠ评分低分组(以下简称低分组,n=24)、冠状动脉SYNTAXⅠ评
正电子发射断层成像技术被认为是研究活体生物生理学、新陈代谢和分子合成途径的最灵敏的、非侵入式技术。其通过探测生物体内放射性示踪剂分布,可定量计算生物体内各器官的代谢水平。随着临床PET技术的逐渐成熟,其对临床疾病早期检测、疾病分期及疗效评估等至关重要。增加轴向FOV是当前PET系统发展的一个趋势,长轴的一个重要的优势是提升系统灵敏度,降低探测器扫描时间。通过稀疏化探测器模块,从而提升轴向FOV是一
目的:探讨胆汁酸膜受体TGR5的表达与胆管癌细胞上皮间质转化(EMT)的关系,分析胆管癌组织中TGR5的表达水平与胆管癌的组织病理学分级及患者预后的关系。方法:收集西部战区总医
近年来,随着我国高速铁路的迅速发展,中小规模的站房开始兴建,人们对出行质量的要求日益提高。本文以中型铁路站房为研究对象,调研进站客流情况,分析公共区空间特点。根据实际需求,本文提出将实名制验票、安检、防爆检查均设在站房室内的中型铁路站房公共区平面布局设计思路,并对该布局的空调节能潜力与热舒适性进行分析。为研究铁路客运站进站空间布局、进站流程、服务时间及服务能力等信息,本文对现有已建成运营的大中型铁
不锈钢材料具有良好的综合性能,在石油、化工、核能、海洋、航天等领域具有广泛的用途,因此评估不锈钢材料的在役使用性能显得十分重要。对于在特殊环境下服役的不锈钢材料,主要采用无损检测的手段进行性能评估。热电势(TEP)可以用于精细地表征不锈钢材料的微观结构演变,因此热电势无损检测成为一种非常具有前景的技术。与其他无损检测技术相比,TEP检测的优势在于对材料微观结构的变化更加灵敏,测量相对简单快速,测量
目的探索淋巴水肿过程中皮肤微淋巴管病理学改变和ICG影像学改变。方法对44例淋巴水肿患者(原发性淋巴水肿30例,继发性淋巴水肿14例)行皮肤活检术,切取足背或上臂腹侧全层皮
为了满足5G系统中超高可靠低时延通信(Ultra Reliable and Low Latency Communication,URLLC)在上行链路对时延和可靠性等性能的要求,业界提出了基于非正交多址接入(Non-Orthogonal Multiple Access,NOMA)的上行免授权传输方案。然而,NOMA技术的引入在带来系统容量增加和频谱利用率提高等益处的同时,也增加了接收端的难度。由于
随着物联网技术的发展,网络业务激增,需要在网络边缘部署大量的移动异构终端以提供服务。由于移动终端节点的资源有限、移动轨迹不确定、网络拓扑动态变化,致使源节点与目的节点之间无法保持稳定的连通链路,由此形成的网络称为延迟容忍网络(Delay Tolerant Network,DTN),也称为机会网络。DTN在应急救援、智能城市、边远地区、野生动物监测和空间通信等领域应用广泛。尽管DTN具有延迟容忍的特