论文部分内容阅读
高性能计算为解决所面临的科技难题提供了强大的计算能力,并将大大促进经济的发展和生活水平的提高。目前,并行计算是高性能计算采用的一个主要实现方式,其中GPU就是一个不错的选择。GPU的图形计算有着天然的内在并行性,其内部拥有大量的并行计算单元,这使得GPU吸引了许多从事于并行计算研究的学者的关注。自NVIDIA在2007年推出CUDA架构以后,GPGPU(General Purpose GPU)在科学技术和工程领域获得了大量成功的应用。本文主要围绕视频去隔行、图像插值和二维海面模拟这三方面的问题在GPU上的通用计算进行研究。这三个问题都存在计算复杂度高的问题,但是它们的计算过程存在着高度的并行性。因此,我们借助CPU-GPU异构平台提供的强大计算能力,对这三个问题进行并行实现,并进行了精细的优化,最终大大提高了它们的执行效率。本文的主要研究内容如下:1.基于边缘自适应场内去隔行方案是根据图像中像素的关联性,估计出空缺位置的像素点。该算法有效的改善了视频的画面质量,同时为不同视频扫描格式转换搭起了桥梁。利用隔行扫描图像上已知的像素,通过预测模型求出奇场偶数行或偶场奇数行上的未知的像素,最终估计出逐行扫描的图像。该算法的计算过程具有天然的并行性,每一个缺失像素的估计过程都是独立的。因此,我们在基于CPU-GPU的异构平台上设计并实现了该方法的并行方案,利用共享内存、寄存器、异步数据传输和多GPU优化,最终得到了94.6x的加速比。2.通过基于自回归模型的图像插值方案获得的重构图像,在图像质量和视觉效果方面都优于过去被普遍使用的线性插值方法。整个算法分为两步:首先根据采样图像上的已知像素构造预测模型,获得重构图像上未知像素的预测权值;然后根据第一步求得的未知像素对已知像素进行反馈,调整预测权值,最终求得整个算法的最优解。由于高分辨率图像上的每一个未知像素的插值过程是独立的,因此我们可以充分利用GPU强大的计算能力对插值过程加速。经过精细优化,在保证图像质量一致的情况下,最终获得了21.2x的加速比。3.二维海面模拟是研究海洋及其上面组合物体的电磁散射的关键技术。本文的二维海面模拟是建立在海浪谱的线性波理论的基础之上,通过线性叠加法实现二维海面的模拟。在生成二维海面过程中,采样间隔越小,模拟的海面越精细,这意味需要更大的计算量。由于每个采样点的计算是独立的,因此我们可以采用并行的策略来实施更加精细海面的模拟。本文在CPU-GPU平台上实现了二维海面模拟的并行方案,大大提高了海面模拟的执行效率,最终获了315.9x的加速比。