论文部分内容阅读
随着通信、计算机、微电子等技术的飞速发展,无线通信标准呈现出不断演进、多种标准兼容的发展趋势,对基带处理架构的计算能力和灵活性提出了更高的要求,给架构设计人员和芯片研发人员提出了巨大的挑战。目前主流的通信协议,如LTE-A、WiMAX、Wi-Fi等,均采用了多天线MIMO技术和正交频分复用OFDM技术作为核心的基带信号处理方案。粗粒度可重构架构具备硅后功能定制的特征,通过对结构可变的硬件进行配置以适应不同算法的处理需求,兼备通用处理器的灵活性和ASIC的高能效性,是实现通信基带信号处理算法的理想硬件平台。论文在细化并扩展传统模型的基础上,建立了系统、精确的可重构架构解析模型,指导并优化面向通信基带的领域专用粗粒度可重构计算架构RaSP-BB(ReconfigurAble Signal Processor-BaseBand)的设计,在实现MIMO-OFDM核心算法时获得较高的阵列计算效率和存储访问性能。论文的主要工作与创新点为:(1)建立了可重构架构解析模型,包括基于流水线气泡分析的循环内核模型、基于访存权重分析的片上存储访问模型和基于算法配置流分析的多任务同步模型。在对算法特征参数与硬件微结构参数抽象的基础上,模型通过定量分析各类参数与系统性能解析关系的建模方法,完成对程序执行时间的准确评估;同时,模型提供程序执行CPI(Cycles per Instruction)栈,定位系统性能瓶颈,从而指导架构设计。(2)优化了RaSP-BB的计算阵列,提出了多组织结构的路由形态,改进了阵列接口结构:在传统crossbar结构的基础上增加同层累加互联以适应基带算法数据流,并利用不同数据局部性特性设计基于访问特性自适应的阵列多输入输出源接口,从而在有效提高阵列利用率的同时减少阵列执行的流水线气泡。(3)优化了RaSP-BB的层次化存储结构,提出了基于地址重映射的无冲突共享存储结构,改进了多模态自适应的本地存储:通过改变共享存储体中的算法分配机制和阵列/存储间硬件步长映射逻辑,以及利用多模态自适应存储支持转置、交叠、拼接等访存模态,从而在处理基带算法时有效地避免计算引擎间数据传输,降低访存冲突和访存模态带来的访问延时。为了验证上述面向通信基带信号处理可重构架构的设计方法,论文实现了基于RaSP-BB的RTL模型并进行了仿真验证。通过对比RTL仿真及解析结果,解析模型在可重构架构REMUS-Ⅱ和RaSP-BB上的评估精确度较高,分别为94.52%和93.83%。基于TSMC 45nm工艺,RaSP-BB在工作主频为400MHz时,处理无线通信基带信号处理核心算法的RTL仿真性能如下:4096点FFT的处理周期为3295 cycles(8.23 ns),采用K-best算法处理4×4 MIMO检测的吞吐率达1072 Mbps(K=3时),Mapping和De-mapping映射时间为0.55和0.28 cycle/symbol,32-Tap FIR的处理速度平均为2.4 cycle/symbol。与REMUS-Ⅱ相比,RaSP-BB核心算法性能平均提升39.98%。与当前主流可重构架构相比,RaSP-BB架构针对计算、访存较复杂的算法如FFT、MIMO检测等,可以获得较优的算法性能;同时也能较好的支持调制映射、FIR等其他通信基带算法,具有足够的灵活性。