基于CUDA的帧间预测优化及并行化

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:bitbooy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为H.264/AVC编码框架的主要模块,帧间预测模块通过多帧预测、亚像素运动估计、基于率失真优化的模式决策等方式实现压缩效率的提升,但也使得整个模块耗时长,资源占用率高;另一方面,基于GPU的并行编程框架CUDA(Compute UnifiedDevice Architecture)的不断发展,使得GPU成为计算机上另一个可编程以及可执行单元,与此同时GPU在科学计算领域的计算能力已远远超过CPU;因此,考虑如何基于CUDA平台加速帧间预测模块达到整体编码效率的提升已经成为多媒体技术和高性能计算领域研究的热点问题。通过对多种分辨率、帧率以及视频数据的统计数据发现,在帧间预测编码过程中运动向量在局部域和全局域分布具有趋势一致性的特征,并且不同模式编码块的运动向量具有强相关性;基于以上规律以及CUDA平台的特征,对串行环境下的帧间预测模块从整体框架和核心算法两个角度进行优化,主要有:(1)基于CUDA平台将帧间预测模块划分为插值滤波模块、运动估计模块和多模式运动向量合成模块等若干子模块;(2)针对传统全搜索算法在搜索机制上的盲目性和快速搜索算法多条件分支难以在充分调用CUDA平台计算资源的特点,提出并实现了面向运动趋势的自适应迭代搜索算法;(3)为降低单线程计算负载、充分利用邻域运动信息同时避免因数据依赖而导致并发度不高的问题,提出并实现了基于域划分和双抽样的预搜索机制;(4)基于运动向量的层间相关性特点,提出并实现基于层间编码块的最优运动向量合并机制。实验结果表明,相比全搜索算法,面向运动趋势的迭代搜索算法可以达到70~80倍的性能提升,同时SNR保持在0.5dB以下;同快速搜索算法相比,加速可以达到3~4倍,且压缩率更高;相比基于CUDA平台的运动估计算法,可提升约20%的编码效率。
其他文献
随着国民经济的飞速发展,城市人口日益膨胀,机动车辆相应急剧增加,城市交通运输的压力越来越大,环境污染加重。发展公共交通是为居民提供一种安全快捷舒适的出行方式的不可替代的
项目协调是动态联盟项目管理中的重要部分。盟员企业在生产实施中,必须对生产计划进行不同程度的修改和调整,以保证在规定的时间内完成预定的生产目标。项目协调分为整体的项目协调和局部的项目协调,此外还要解决伙伴选择和冲突消解。本文重点研究动态联盟项目的协调与优化问题,首先论述了动态联盟项目的协调机制,分析了动态联盟项目协调的价值基础、关键要素,给出了基于信息平台的企业动态联盟协调管理的总体框架。然后分析动
随着Internet 技术的不断发展,Web 应用需求日益增多,涉及的领域越来越广,Web 应用系统的复杂性也变得越来越高。为适用形势的发展,人们提出了应用系统的多层体系结构,并逐渐
随着互联网的迅速普及和广泛的应用,以及我国的电子政务系统逐步构建完成以后,政府的许多工作移植到网上实现。如果在推进电子政务的过程中,对支撑各个部门的各种应用系统缺乏统
由于嵌入式移动设备的存储容量有限和电源无法持续供电,保证移动设备中数据的安全性和可用性成为一个重要课题。嵌入式系统的特点决定了移动设备不能像普通计算机系统那样,通
中国3D电视实验频道试播,2013年春晚进行3D录制,将3D影视带入到了千家万户中,3D电视机已经大规模上市。3D影视具有强烈的立体空间感,给人更逼真的视觉感受,国内外涌现一波又一波的
摘要 开放式一体化网络的安全问题涉及到很多方面,是一个集技术、管理、法规于一体的复杂系统工程。目前,国内在这些方面的研究还不能跟上网络技术的发展。安全法规、安全管
图片搜索是可视搜索的重要研究方向,智能手机的普及让移动端拍照产生图片的数量大量增加,从而使得对图片的搜索需求变大,特别是购物类的搜索需求。基于内容的图像检索技术是解决
本文在对常见的三种网络存储技术NAS、SAN、iSCSI的特点和应用场合进行分析和比较的基础上,对目前常用的基于IP和基于同步光纤网的两种存储扩展技术进行了较深入的分析;前者又
三维图形技术是近些年来发展较快的技术之一,它在游戏娱乐,虚拟现实和计算机辅助设计与制造等领域有了越来越广泛的应用。作为三维图形技术的核心技术产品,三维图形引擎的市场一