H.264/AVC视频压缩编码在CUDA平台上的并行实现

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户:peter_wan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来通信技术、存储技术及处理器技术发展迅速,通信方式已发展成为视频音频通信方式,人们对图像质量的要求也日益升高。H.264视频编解码标准是新一代视频压缩编码国际标准,采用了包括帧内、帧间预测、整形变换和量化、熵编码和环路滤波等一系列先进技术,保证了预测的准确性,提高了解码图像质量,但同时也增加了时间复杂度。GPU和多核CPU的出现意味着主流处理器芯片已进入了并行时代,且其并行性还会不断扩展。这就需要开发出可透明地扩展并行性的应用软件。CUDA就是在这样的背景下应运而生的,CUDA是一种并行编程模型和软件环境,专用于解决可表示为数据并行计算的问题。因此如何利用CUDA多线程来降低H.264的时间复杂度,提高编码效率是本文的研究重点。本文以H.264视频编码标准的JM16.0模型中采用的环路滤波算法为研究对象,研究了边缘滤波强度的计算方法,分析了先垂直后水平的滤波顺序,发现环路滤波算法复杂且有规律的计算特性符合CUDA应用条件,在此基础上本文提出将滤波强度计算和亮度滤波两个步骤做了并行设计和实现,设计重点在于线程完成工作的定义和如何根据算法组织线程以更符合实际图像的格式需求,同时也能发挥CUDA的并行优势。帧间预测是H.264视频编解码的关键技术之一,本文在研究了JM86编程模型的帧间预测算法所采用的全局搜索法、分数像素搜索、快速搜索法等运动估计算法后,分析了各种算法匹配结果的优劣和时间复杂度,因全局搜索的计算量最大且规律性较强,所以本文提出了在CUDA上实现全局搜索的并行,降低了算法的时间复杂度。设计的重点是最大限度的实现搜索过程的并行,把一帧内的宏块SAD计算同时移植到GPU的CUDA平台上并行计算,从而降低CPU负荷,让CPU去处理其他响应。实现并行算法的环境选择Linux操作系统和GTX260+的显卡,以得到精确的编码时间和较高的并行效果。本文通过将以上两个并行设计的算法在此环境中实现,并且以不同大小的测试用例进行测试,测试结果表明,本文提出的并行处理算法优化了环路滤波和帧间预测两种算法。
其他文献
随着Internet的飞速发展,传统电信运营商迫切希望将业务领域拓宽到Internet以寻求新的增长点,而Internet用户也希望能够使用到便捷、可靠的电话网服务,电信网与互联网业务互
心电图(ECG, Electrocardiography)是医生分析心脏基本功能及其病理的重要依据,因此,对心电信号进行分析、识别、分类有着重要的意义。本文首先对现阶段心电的研究现状及常用
随着3G网络的大范围部署,个性化增值服务的需求越来越多,流媒体是其中重要的内容。但目前IMS系统中流媒体应用服务器设计的相关协议和标准并不成熟,相关应用也尚不完善,所以研究I
语义Web服务是传统的Web服务在最新的语义Web技术下的延伸,能够使网络环境下异构Web服务的组合过程呈现运行时的动态性、自动化和智能化等特征,具有非常重要和广泛的应用前景
测试用例的共享复用是提高软件测试效率和质量的有效方法,逐渐成为软件测试领域研究的热点。本文在对国内外软件测试领域研究现状的分析基础上,发现测试复用领域的研究还存在
智能电网是电力工业的一场巨大变革,将引起电力工业在各个领域的革新。智能调度是建设统一坚强智能电网的关键内容和智能输电网的神经中枢。基于SOA的电网调度支撑平台是智能
来自中国互联网信息中心的数据称,互联网数字分配机构地址池中的 IPv4地址已经分配完毕。可见当今互联网的发展已经达到鼎盛时期。而现在的中国的互联网更是爆炸式发展,中国
SIP因简单、易用等优点成为下一代网络的核心信令控制协议,因此基于SIP的服务和产品大量涌现。由于SIP所处的开放、复杂的网络环境和协议自身缺乏安全机制,导致SIP服务和产品面
随着新型遥感数据应用的日益广泛和深入,快速而准确的提取信息已成为制约遥感应用的瓶颈,对遥感图像进行分割已成为解决这个问题的重要手段之一。基于图论的图像分割方法能够
随着移动互联网技术的发展和移动终端的不断普及,文字识别技术蓬勃发展且日趋成熟。手写输入作为移动平台上的一种高效文字录入方式,被越来越多的使用者所接受。近三十年来,