基于CUDA平台的FIR滤波算法的设计与优化

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:whqqqqqqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目前基于普通DSP的FIR算法速度低、扩展性差的缺点,提出并实现基于CUDA平台实现的FIR滤波算法。由于在CUDA中程序可以直接操作数据而无需借助于图形系统的API,使开发者能够在GPU 强大计算能力的基础上建立起一种效率更高的密集数据计算解决方案。该算法将CUDA用于FIR滤波器输入输出关系计算,采用矩阵乘法的并行运算技术,在GPU上建立并行滤波模型,并对算法进行了优化。实验结果表明,在Tesla C1060平台上,和传统的基于DSP的FIR滤波算法计算速度相比,基于CUDA平台计算FIR滤波算法
其他文献
阴影是虚拟环境中真实感的重要特征。由于并行分割的阴影贴图算法的通用性和效率,它对大规模复杂的虚拟环境中的实时阴影渲染起了重要作用。但是对于塔台仿真系统这样的大规模动态场景,锯齿现象依然存在,利用差值阴影贴图等方法,对其效果进行了改进,并利用GPU强大的浮点数运算能力和并行处理能力加速了阴影的实现,有效地保证了阴影的真实性和实时性。实验结果表明生成的阴影边缘柔和,抗锯齿效果好,有效地解决了偏离和光渗
针对经验模态分解中存在的端点效应问题,提出了一种基于标准化自协方差相关窗函数的改进算法。利用标准化自协方差相关函数作为判定准则,在原信号内部寻找与端点处波形最相似,幅
为了解决现有中华文化BBS系统分别存在的使用中文、功能不完善、内容不全面的问题,文中采用信息系统开发的结构化方法,通过系统分析,包括绘制数据流图和进行中华文化分类;系统设
针对于行为分析的Android恶意代码检测技术均需要收集大量的运行数据,文中提出了一种基于用户模拟交互技术的数据收集方式。使用计算机及若干个Android设备,自动化完成有效分析
无线传感器网络是由大量节点和网关设备组成的,节点和网关的分布范围非常广泛,有时它们可能被分布在人迹罕至的恶劣环境中。根据应用需求,经常需要对节点和网关的软件进行更新或
在RFID系统中,一个阅读器在同时有多个标签响应时就会发生标签碰撞。文中通过在标签内设置一个编码单元,提出一种基于标签位编码单元(BCU)的双时隙RFID防碰撞算法。该算法中,采用位编码单元对碰撞位信息进行重新编码,使阅读器不需要遍历查询就能一次性识别标签的碰撞位信息,从而降低了查询的次数,减少了二进制树算法延时,使得标签能够快速识别。算法性能分析和仿真结果显示,文中所提出的算法在存在大量标签的环
在云环境中,如何将大量的虚拟机调度到物理节点上是一个基本且复杂的问题。文中首先对虚拟机的调度建立装箱问题模型,将该模型的求解转化一个多目标优化问题,目标分别为负载
减少空闲侦听是延长无线传感网络生命周期的有效途径。文章分析了无线传感网络在数据处理和数据传输时的能耗问题,提出了一种支持多分辨率查询的数据存储策略。该策略是将指定
旅行商问题中巡回路径的数据结构对局部启发式算法的效率起着非常关键的作用。巡回路径的数据结构必须能够查询一条回路中每个城市的相对顺序,并且能够将一条回路中的部分城
将HDFS应用于云存储备份系统已引起学术界和企业界的广泛关注,但是HDFS假设集群中的节点是同构的,且在数据块的放置时采用了随机的数据放置策略,而在实际的云存储系统中节点的同