面向众核处理器的硅后调试关键技术研究

来源 :国防科技大学 | 被引量 : 1次 | 上传用户:ahutxhb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高性能处理器的集成度和设计复杂度越来越高,硅前验证因其仿真速度慢和电气模型不够准确等原因,已经不足以在流片前找出全部故障,因此硅后验证技术受到了越来越多的重视,其中硅后调试作为硅后验证过程中最困难也最耗时的步骤,已经成为高性能处理器领域的研究热点之一。众核处理器作为高性能处理器系统结构的一个重要发展方向,在验证和调试领域面临着同样的困境,而且由于众核处理器的设计更加复杂,需要验证的状态边角和工作模式也呈爆炸式增长,给验证和调试带来了前所未有的挑战。本文针对处理器硅后调试中遇到的跨时钟域信号亚稳态、时钟停顿情况下的DRAM内容失效及访存延时变化等问题,提出了确定性单步可调硅后验证系统;以此为基础,设计了基于NoC(Network-on-Chip)的高带宽、低开销众核处理器调试系统架构,对支撑众核处理器中可调性设计的关键组件进行了详细设计;开发了支持单步调试功能的高速串行接口适配器以及硅后测试故障屏蔽等关键结构与技术,以增强处理器硅片的可观察性和可控制性。本文的主要工作和创新体现在:(1)提出了基于NoC的高带宽、低资源开销众核调试系统架构。硅后调试过程困难的根本原因在于硅片的可观察性和可控制性弱,通过片上踪迹捕获等DFD(Design For Debug)技术,可以提高对硅片内部状态的观察能力,但仍不能满足调试过程对于快速定位的需求,进一步提高观察能力则会占用过多的硬件资源。本文面向众核处理器,提出了一套基于NoC技术的高带宽、低资源开销的众核调试系统结构,并针对此结构的关键支撑技术进行了深入研究,提出了基于硬件队列的快速故障检测、基于分布式低硬件开销嵌入式逻辑分析仪的信号踪迹捕获、基于确定性执行和检查点机制的软件踪迹捕获、延迟均衡的交叉触发信号网络和高精度时标信号网络等设计技术。在某国产众核处理器基础上设计实现了本文提出的调试系统结构,实验结果表明,所提出系统结构能够有效改善处理器可调性,各支撑组件的功能均达到了预期效果,而调试系统资源占全芯片资源比例仅约为0.39%。(2)提出了一种确定性单步可调的众核处理器硅后验证系统设计技术。影响硅后验证系统确定性单步可调的关键因素有三个方面:亚稳态引起跨时钟域信号延迟不确定的传输、单步调试过程中时钟停顿过程引入非确定性、时钟停顿情况下存储控制器的DRAM内容丢失和访存延迟不确定。受近期跨时钟域信号确定性传输研究进展的启发,本文深入开展了针对后两个问题的研究,基于有限状态机理论推导了硅后芯片实现确定性单步可调的各项条件,提出了一种确定性单步可调的众核处理器硅后验证系统设计技术,包含两项创新技术:基于时钟抖动范围控制的确定性单步调试方法和基于延迟预测机制的确定性单步可调存储控制器的设计方法。FPGA平台上的实验结果表明,为实现上述方法而增加的资源面积,相对全芯片逻辑增加的比例不超过0.36%,对系统平均性能的降低仅1.60%。同时,基于本创新点构建的确定性单步可调硅后验证系统,也是本文众核调试系统架构设计的基础。(3)提出了支持单步调试功能的高速串行接口适配器设计方法。在硅后调试过程中,硬件仿真器是调试硅后故障的重要辅助工具。但是现有硬件仿真器在连接高速串行接口IO设备的情况下,不支持单步调试功能,导致在调试硅后芯片中的IO相关故障时,硬件仿真器的功能不能被有效利用。本文针对此问题提出了一种支持单步调试功能的高速串行接口适配器设计方法,并针对仿真器上高速IO通道延迟不准确的问题,提出了在适配器上进行补偿的方法。基于FPGA平台的实验结果表明,所设计的适配器能够在仿真器时钟停顿期间有效维护与真实设备的连接状态,在合适的延时补偿配置下,系统IO性能仿真的结果与真实设备更加接近。(4)提出了基于系统状态备份与恢复技术的故障屏蔽方法和基于数据流量控制的硅后故障在线屏蔽方法。已经定位的硅后故障会破坏部分验证激励的正常执行,这可能导致其他硅后故障被隐藏,逃逸到下一次流片阶段。针对此问题,本文首先设计实现了处理器的状态备份与恢复方法。基于此方法并依据硅后验证平台的确定性特征,本文提出了一种基于系统状态备份与恢复技术的故障屏蔽方法。首先利用硬件仿真器获取系统在故障修复后的正确状态,然后在硅片上的故障发生时刻,使用硬件仿真器的正确状态覆盖硅片的错误状态,消除故障带来的影响,进而实现屏蔽故障的目标。另外,针对实际应用环境,本文还提出了一种通过控制数据流量实现在线屏蔽部分硅后故障的方法,该方法主要适用于IO部件等处理器内核以外的逻辑部件中的故障。基于FPGA平台的实验结果表明,针对DMA控制器中的一处逻辑故障,上述两种方法均能够有效屏蔽该故障,并且流量控制方法引起的数据带宽损失不超过2.5%。
其他文献
随着互联网迅速全面的普及,各种基于互联网的服务和创新不断推出,国家顺应时代发展的潮流制定“互联网+”战略,鼓励包括金融业在内的各种行业充分利用互联网的思维和技术重新
高校毕业生是参与就业市场的主力军,商科类专业毕业生占毕业生比例大,部分毕业生存在就业困难,成为困扰学校、学生和家长的重要问题。高校应对就业困难原因进行深入分析,采取
以浙江省某生活垃圾焚烧发电厂的渗沥液处理工程为实例,介绍了垃圾渗沥液的处理工艺。该工程采用“预处理+厌氧+MBR+NF/RO双膜法”处理工艺,渗沥液处理规模为800 t/d,浓液采
<正>课程:高中语文必修5(人教版)专业:语文授课课时:第二课时一、教学内容分析学习内容的分析:《陈情表》选自(人教版)高中语文必修五第二单元,本单元在必修五中属于"品味与
会议
2018年京津冀旅游年卡正式在我市发售,为天中旅游市场注入活力。我市消费者持卡不仅畅游北京、天津、河北等地的景区,还可免费旅游包括南街村、神州鸟园、老乐山风景区、薄山湖
报纸
作为枸杞保存、保鲜的重要一步,枸杞制干一直是枸杞产业的重要研究对象。相对于传统的枸杞制干方法,真空脉动烘干具有不加碱、污染小、除菌效果好、农药残留少等诸多优点。本
为了提高风电系统输出电压的稳定性,设计了单相正弦脉宽调制逆变器,将风电机组输出的24 V交流电压经整流电路变为直流电储存在蓄电池中,然后把直流电经逆变电源变成220 V、50
系统的观测以及滤波器问题是现代控制理论的重要研究课题,已经得到国内外众多学者的大量研究.其中基于线性二次条件的估计问题是具有相当多的研究和相关的应用.截止目前,线性
近年来,由于计算机和网络技术的快速发展加快了库存管理过程信息化的进程,使得作为库存管理核心部分的货物盘点工作承受着信息化时代的强烈冲击。传统的货物盘点模式由于缺乏完善的管理流程往往存在盘点工作冗余、盘点记录损毁严重及人员工作安排无组织、无计划等诸多问题,不仅降低了库存管理的效率,甚至影响到了企业的正常运转。因此,以信息处理为主的全新盘点模式引起了众多对存货状态要求较高的企业及其高层的关注,而盘点工
本文对西藏城乡居民收入绝对差距和相对差距特征进行了分析。从产业结构层面、家庭收入层面及政策层面三方面,分析了西藏城乡居民收入差距变动形成的原因。提出了"十二.五"西