基于通用可重构CPU的视觉处理API库研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:hao8035
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着视频处理技术的不断进步,需要处理的数据量越来越大,对数据处理电路的性能、功耗和灵活性要求也越来越高,可重构处理器的并行处理技术成为提高计算效率和降低功耗的良好解决方案。目前主流的视觉信息处理算法具有规则的数据依赖关系、集中的计算复杂度、基于块的并发执行等特点,可重构处理器在这些视觉信息处理算法上具有明显的优势。本文首先根据可重构处理器GReP的基本架构以及编程模式,设计了4种不同的定点除法kernel,并分析了不同方案的性能与资源代价,给出了不同方案的适用范围。然后针对浮点运算,本文提出了浮点乘加运算在GReP架构上的映射方案,分析了该配置方法在GReP架构上对浮点运算性能的提升,并给出了不同算法下,浮点乘加单元的具体使用方法实例。最后,本文提出了视觉信息处理API函数库的接口规范,给出了分析映射视觉信息处理API函数的一般流程。并根据ALU单元的功能以及设计的除法与浮点运算kernel,映射了三类视觉信息处理算法,建立起了API函数库。本文将视觉信息处理算法在Intel ATOM 230测试平台下进行了串行性能测试,同时将拆分映射好的API函数在SoC Designer可重构处理器测试平台上进行了并行性能仿真。实验结果表明,Harris角点检测、归一化互相关、随机抽样一致、二维离散余弦变换、双三次插值、中值滤波6个算法的并行效率分别是传统串行实现方式的3.34倍、19.24倍、7.29倍、4.73倍、7.23倍、8.98倍。浮点乘加运算,性能提升2.09和1.67倍。对于具体的浮点算法,计算4*4矩阵相乘性能提升1.88倍,7*7高斯滤波提升1.87倍。因此,本文设计的视觉信息处理API函数库不仅降低了应用程序的开发难度,而且很大程度地提升视觉信息处理应用程序的性能。
其他文献
“移动改变生活”,随着4G逐渐走进人们的生活中,高吞吐率、低误码率、干扰最小化、电池寿命最大化的优越性直接显现在通信过程中。在通信系统中,干扰和功率问题是仅次于频率
本文主要阐述了中职学校“装配钳工技术”赛项现状以及中职钳工教学中存在的学生学习兴趣低、效果差,基础设施不健全,学校所学与岗位工作内容不相适应等问题;着重讲解了基于
本文在系统综述国内外生态系统服务研究进展和森林生态系统服务内涵及其形成机制的基础上,从生态系统结构、生态过程与生态功能的关系入手,探讨了辽宁省建平县主要类型人工林生
LTE-Advanced(LTE-A)是LTE技术的演进,在保持对LTE后向兼容的基础上,又引入了许多新技术。其中中继技术不仅可以和宿主基站交错布设以获得更大的覆盖范围,还能和宿主基站重复
记得三四岁时,我在家里书房的墙上画满了涂鸦。画的内容现在全然忘却了。当时若能有照片记录,或者儿时的书屋依然保存完好,对我来说一定是件相当重要的作品。我五岁就被送到
从一幅尺寸较小的图像获得尺寸较大的新图像的数字图像处理技术,称为数字图像放大。随着计算机技术的不断更新,数字图像放大作为图像处理技术中的重要组成部分,目前已经广泛
初中化学教学是学生接受化学教育的启蒙和基础阶段,要提高化学课的教学质量,应从培养学生学习兴趣,激发他们的求知欲入手,从提高课堂教学效率做起,引导学生克服初中化学课时少、任
蛋白A亲和介质纯化抗体是目前最为常用的抗体纯化制备手段之一,具有纯度高、回收率高等优点,但是其保存要求和制备成本也较高且实际的结合效能不高。改造蛋白A的结构,提高抗体结
本文通过对荣华二采区10
期刊
本文探讨了一个名为“多项式法”的新颖控制器设计方法以及它在运动控制中的应用。多项式法独立于经典控制和现代控制,通过对闭环传递方程的代数设计求解控制器参数。在低阶控