论文部分内容阅读
随着通信和多媒体领域应用变得越来越复杂,传统的基于集成电路(ASIC)的解决方案由于研发成本高,灵活性差,显得越来越不适用。取而代之的,以处理器,特别是多核处理器,为核心的系统正逐渐成为焦点。处理器具有良好的可编程性和灵活性。相比与设计一款ASIC芯片,基于处理器的系统的实现成本非常低。但这目前处理器的功耗和性能仍然很难与ASIC相比,往往不能满足当今应用的需求。 针对上述问题,本文面向通信和多媒体这两个特定领域,对多核处理器进行优化,研究了多核处理器设计过程中的一些关键技术,力求缩小多核处理器与传统ASIC之间的差距,设计一款高性能低功耗的多核处理器芯片。本文的主要工作如下: 1.簇状多核处理器的整体架构 本文所设计的处理器采用了簇状架构。同一个簇内的处理器联系非常紧密,他们之间可以进行高效的数据通信,并共享有存储器,运算单元等资源。虽然所有的处理器核是同构的,但簇与簇之间的功能有所不同,有的簇含有较大的数据存储器,而其他簇则含有针对通信和多媒体的加速单元。每个簇都含有自己独立的时钟源,各个簇可根据其工作量选择不同的工作频率。 2.SIMD指令集扩展及流水线优化 本文在兼容MIPS常用指令的基础上进行了指令集的优化,增加了丰富的SIMD指令,这些SIMD指令极大地增强了处理器核的并行处理器能力。此外,针对处理器核的一些硬件特性也增加了相应的特殊指令,方便对相应硬件模块的访问,如check,regconfig等。同时,由于SIMD指令的位宽非常灵活,还相应地对流水线作了优化,主要包括对数据运算通路进行细分,设计多位宽的旁路通路等。 3.多页式前后台寄存器堆 本文提出了多页式前后台寄存器堆的结构,此结构在寄存器寻址位宽不变的情况下,将寄存器的容量扩大了3倍。在同一时刻,只有32个寄存器可以被处理器核的流水线访问,这些寄存器被称为前台寄存器,而其他的寄存器被称为后台寄存器。流水线在处理前台寄存器中的数据时,后台寄存器可以通过DMA进行数据的预取或者结果的写回。这样大部分访问存储器的指令都可以用后台数据搬移来取代。此外,许多特殊功能也直接映射在了寄存器堆中,从而可以方便快速地访问。 4.全局片上网络局部共享存储器的通信策略 本文设计的处理器中,采用了全局片上网络互连,局部共享存储器的通信策略,同时支持这两种通信模式。基于共享存储器的核间通信最大的好处就是容易使用、编程简单。而基于片上网络的核间通信则具有良好的扩展性和灵活性。使程序在不同的场合可以使用不同的通信方案,从而提升了其整体性能。 5.融合包交换和链路交换的双层片上网络 本处理器中还对传统的片上网络做了优化,将传统的包交换网络与链路交换网络进行了融合,通过发送链路配置包的方式来打通链路网络中的通信路径,既兼顾了灵活性又大大提高通信的能量效率。处理器核可以十分方便地访问片上网络,而且此网络还支持后台数据搬移,可以直接通过DMA进行数据传输。 6.芯片实现与测试 本文完成了多核处理器的硬件设计后,还进一步完成了芯片的后端实现以及芯片测试等工作。此芯片基于TSMC65nm LP工艺,约含2000万个晶体管,正常工作情况下,频率可达850MHz,但单核功耗仅22mw,能量效率为39GOPS/W。除了进行性能测试外,此处理器上还运行了H.264帧内解码,LTE关键模块等应用实例,都达到了较好的性能。