基于GPU的函数卷积算法

来源 :东南大学 | 被引量 : 0次 | 上传用户:dlll9393
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积算法为通用计算中的重要环节,在计算机视觉和图像处理中,实现高效快速的卷积运算至关重要,卷积经常被用于模板匹配,边缘检测,图像滤波和图像定位等多方面领域。本文主要针对二维函数的卷积算法在GPU上的实现与加速进行相关研究。   论文首先介绍了GPU的发展现状,以及在通用计算领域的相关应用以及并行计算的相关知识。然后介绍了NVIDIA公司开发的CUDA平台,即本文中实验开发所用平台的相关背景知识。   在二维图像数据卷积滤波中,主要分为两种不同的基本方式:在空间域中滤波和在频域中滤波,当待处理的图像比较大的时候,CPU的结构特点决定了其的性能往往不能满足图像滤波的实时性要求,而GPU为SIMD架构,决定了它非常适合处理大量数据的运算。在论文中,将详细介绍有关卷积运算的原理以及在GPU下实现的方法。   本文将在CUDA平台下实现卷积运算,包括通过基于FFT的方法实现卷积,利用卷积核可分离的特点实现卷积,并通过共享内存管理,合理分配线程的方法加以优化,另外通过纹理存储器具有高速缓存的特点存储数据,来实现卷积与之进行结果比较。通过这几项实验,可以得到结论:利用GPU实现的卷积运算可得到与CPU计算相同的结果,而速度远高于同时代CPU所得达到的运算速度,尤其是在大规律数据量的运算上更是如此,而纹理内存实现的卷积运算并非最为理想的实现方法。   最后,针对实验中存在的问题与不足提出后续工作的方向。  
其他文献
培训用仿真机在火电厂和核电厂中得到广泛的应用,它的开发和应用在保证电厂的安全经济性上起到了重要作用。国内主力机组均已有相应的培训仿真机,但135MW机组的培训仿真机还很
近年来,以薄板坯连铸和薄带钢铸轧等新兴短流程连铸工艺为主要特征的"近终形连铸技术"(NNSCC)的开发应用把连铸技术推向新的发展阶段.针对近终形异径双辊不锈钢薄带液态铸轧
该文针对堆肥过程中的热质传递问题进行了理论分析和现场测试,针对堆肥过程,重点对槽式堆肥过程建立了多孔介质传热传质模型,考察了各种堆肥参数对堆肥质量的影响规律以及堆
该文以宝钢RH-KTB系统的实际项目作为研究对象,开发了RH-KTB故障诊断专家系统及数据分析软件.针对宝钢从国外引进的设备,建立了多点的监测系统,并配合高抗干扰性、高准确度的
研究背景:组织工程血管以及组织工程化组织的血管化因目前内皮种子细胞扩增能力和生物活力的不足而受到限制。内皮祖细胞(endothelial progenitor cells,EPCs)是内皮细胞的前
将吸收式制冷系统用于远洋渔船的海产品冷冻保鲜是解决我国远洋渔船污染环境、浪费能源的重要途径之一。而了解吸收式制冷系统中最重要的组成部分——吸收器在船舶的颠簸摇摆状态下的性能变化是吸收式制冷系统能否用于渔船的关键。本文主要研究并模拟了摇摆状态下管内降膜吸收过程中的液膜流动流场,为进一步研究摇摆状态下吸收器吸收性能的变化打下了必要的基础。 本文首先研究了船舶在海洋中的运动,建立了船舶摇摆运动的简
针对目前中国大量使用的空调用室外体轴流风机,仍然存在着噪声高,效率低的缺点,该文力求在提高风机效率和降低风机噪声之两方面,能取得一些比较好的成果.该文根据目前在风机
气液两相流动广泛存在于现代工业中,计算机及自动控制学科的发展促进了工业的发展,导致工程中迫切需要对两相流动的流型转换及其内在机理过程分析的理论,由此建立其传递函数,
期刊
目前,中国研制并投入使用的各种卫星均仅以自己的蒙皮作为辐射器用,在设计与制造过程中已越来越感到辐射器面积过小,已不能满足卫星所需的散热要求.同时,针对各种后续卫星及