论文部分内容阅读
随着视频处理技术的不断进步,需要处理的数据量越来越大,对数据处理电路的性能、功耗和灵活性要求也越来越高,可重构处理器的并行处理技术成为提高计算效率和降低功耗的良好解决方案。目前主流的视觉信息处理算法具有规则的数据依赖关系、集中的计算复杂度、基于块的并发执行等特点,可重构处理器在这些视觉信息处理算法上具有明显的优势。本文首先根据可重构处理器GReP的基本架构以及编程模式,设计了4种不同的定点除法kernel,并分析了不同方案的性能与资源代价,给出了不同方案的适用范围。然后针对浮点运算,本文提出了浮点乘加运算在GReP架构上的映射方案,分析了该配置方法在GReP架构上对浮点运算性能的提升,并给出了不同算法下,浮点乘加单元的具体使用方法实例。最后,本文提出了视觉信息处理API函数库的接口规范,给出了分析映射视觉信息处理API函数的一般流程。并根据ALU单元的功能以及设计的除法与浮点运算kernel,映射了三类视觉信息处理算法,建立起了API函数库。本文将视觉信息处理算法在Intel ATOM 230测试平台下进行了串行性能测试,同时将拆分映射好的API函数在SoC Designer可重构处理器测试平台上进行了并行性能仿真。实验结果表明,Harris角点检测、归一化互相关、随机抽样一致、二维离散余弦变换、双三次插值、中值滤波6个算法的并行效率分别是传统串行实现方式的3.34倍、19.24倍、7.29倍、4.73倍、7.23倍、8.98倍。浮点乘加运算,性能提升2.09和1.67倍。对于具体的浮点算法,计算4*4矩阵相乘性能提升1.88倍,7*7高斯滤波提升1.87倍。因此,本文设计的视觉信息处理API函数库不仅降低了应用程序的开发难度,而且很大程度地提升视觉信息处理应用程序的性能。