论文部分内容阅读
流处理器是基于流体系结构,按照流计算模型将应用中的计算和数据分离,并重新组织成一条流水线型的计算链,通过开发数据、指令和任务等多个层次上的并行性和充分利用各级存储层次上的局部性,从而得到较高的计算性能,特别适合数据并行性好、全局数据重用较少的计算密集型应用。文中流处理器基于传输触发体系结构(transport triggered architecture , TTA)设计。TTA结构利用数据传输触发具体操作,能够快速设计出满足特定应用的高性能嵌入式微处理器。荷兰代尔夫特理工大学(Delft University of Technology)第一个提出TTA结构,并设计出基于TTA体系结构的可配置处理器以及对应的一套半自动化的设计工具Move Framework,用来进行ASIP的开发。针对流体系结构的特点,文中选定视频编码协议H.264算法中帧内预测算法作为目标应用。经过资源、性能等方面的评估,该流处理器对帧内预测算法表现出有很好的性能,且较通用DSP性能有明显的提高。此外,在充分分析流处理器架构的特点和帧内预测算法的特点和瓶颈的基础上,提出针对此帧内预测算法流处理器的优化算法,并在Move Framework上生成此快速算法对应的流处理器。经再次验证,快速算法作用明显,进一步提高了流处理器性能。本文提出了一种针对局部计算密集型应用的一种高效处理器架构的设计方法。通过这个方法可以在TTA的架构上面实现计算量大、过程繁琐的算法,例如H.264协议中其它算法等。