论文部分内容阅读
随着嵌入式系统中对于音视频处理、图像识别、3D模拟等多媒体相关应用的日益增多,高效低成本低功耗的多媒体扩展单元将成为未来通用嵌入式处理器的关键部件。本文围绕多媒体扩展单元的架构设计,重点研究合理有效利用现有资源,提升多媒体运算性能,降低硬件开销,减小功耗损失等关键技术。本文的主要研究内容和创新点包括:
⑴隔离式SIMD算术单元及其高效资源复用技术。提出了隔离位拼接操作数实现快速SIMD执行的算法,并以此进行高效资源复用和时延控制的SIMD算术单元设计。该方法通过扩展原整型加法器宽度,插入隔离位分隔SIMD各操作数,仅增加少量选择逻辑,实现了SIMD运算对原有整型通路的高效复用,同时采用逆向移位的操作数准备和封装方案,解决了关键路径问题,以极小的硬件代价实现了对多媒体SIMD加速操作的支持。
⑵树型快速乘法/乘累加单元及SIMD分支提取和延迟旁路技术。首先根据传统阵列乘法器的缺点,分析提出了四叉树型快速乘法器的原理和实现算法,然后在此基础上设计多媒体乘法和乘累加的流水执行单元。根据树型结构的特点,提出分支提取技术实现SIMD运算的高效复用技术,仅增加少量判断选择逻辑,实现了同一乘法器对SIMD运算的支持;同时通过分析MAC指令流的依赖关系,提出了延迟旁路动态调度技术减少累加操作数的相关代价,降低执行停顿,以增加少量旁路逻辑获取MAC指令流性能的大幅提高。
⑶复用式多媒体保留栈动态调度技术及媒体寄存器组框架。通过复用多媒体运算中较少使用的执行单元保留栈,组成更大深度的多媒体保留栈,增加少量控制逻辑,实现了更强的多媒体动态调度性能。对于双字结果的多媒体运算,利用原有重排序缓存资源,增加独立多媒体寄存器组与之配合使用,并复用公共数据总线和退休回写硬件资源,以较少的硬件代价实现了对高位宽数据回写的支持。
⑷基于多媒体运算特征的精细低功耗控制技术。基于SIMD运算特性的低功耗技术,对于每一个子通路进行独立控制,在没有对应运算时彻底关闭该通路以降低功耗;基于结果推测的低功耗技术,对于某些可提前确定结果的多媒体运算,采用旁路逻辑回写最终结果,关闭整个数据通路减少冗余功耗;多媒体动态调度低功耗技术,对复用式保留栈和独立寄存器组根据其写入特点进行独立化和精细化的功耗控制,在没有写入和清除操作时关闭响应时钟以减少动态功耗。