论文部分内容阅读
为了满足多媒体处理等快速向量运算的需求,当今的主流处理器均进行了单指令多数据(SIMD)指令集的扩展。IBM公司、Motorola公司和Apple公司联合开发的PowerPC处理器架构也提供了自己的向量运算指令集Altivec,为复杂的网络处理、多媒体、视频、音频和图像处理等应用提供了高速的向量运算能力。本文针对Altivec指令集设计了一个高性能向量协处理器的运算单元,并把协处理器通过PowerPC处理器预留的Auxiliary Processor Unit(APU)接口与PowerPC主处理器结合。本文还进行了Altivec协处理器的顶层架构,向量浮点运算模块,向量复杂定点运算和加载存储的三个功能单元的设计,以及PowerPC主处理器的耦合设计。本文设计了一个新的基于查找表和乘法的用于除法,倒数,平方根,平方根倒数的浮点数运算算法,并根据此算法实现了浮点运算单元。本设计最后在FPGA上实现。在面积方面,Altivec向量协处理器在Synopsis的.13um的工艺下,总面积为2324669um2,在Xilinx Vertex6 xc6vcx75t FPGA上,LUT数为131。带Altivec向量协处理器的PowerPC405处理器在Synopsis的.13um的工艺下,总面积为3223547um2,在Xilinx Vertex6 xc6vcx75t上,LUT数为33496。在速度方面,Altivec向量协处理器在Synopsis的.13um工艺下,其速度为197MHz,在Xilinx Vertex6 xc6vcx75t FPGA上,速度为153MHz。带Altivec向量协处理器的PowerPC405处理器在Synopsis的.13um的工艺下,其速度为127MHz,在Xilinx Vertex6 xc6vcx75t FPGA上,其速度为102MHz。