AVS视频编码并行算法的研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:goskatecomcn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由中国数字音视频编码技术标准工作组制定的新一代视频编码国家标准AVS(Audio and Video coding Standard),因其具有很高的编解码性能,比H.264要低的复杂度,以及专利授权费用低等优点,越来越得到广泛的应用和学术研究。但是由于AVS采用了最新的视频编码技术,使得编码速度较上一代视频编码标准要低很多。目前,随着多核处理器的普及,利用多核处理器进行多线程并行编码将会有效的提高编码速度。而OpenMP作为一个面向共享存储多处理器系统的多线程编程标准,为程序员编写多线程应用程序提供了一个简单而高效应用程序编程接口。为提高AVS视频编码速度,本文在深入了解并行计算理论、AVS编码标准和OpenMP多线程编程标准的基础上,主要完成了3方面的工作:首先使用OpenMP在AVS编码器官方参考模型RM62f上完成了GOP级、Slice级和帧级并行编码算法。这几种算法都在Intel四核处理器平台上进行了测试并给出了线程数与加速比、PSNR和码率的关系。实验结果表明,并行算法对AVS编码速度的提高非常明显,不过它们还是有各自的缺点。其次针对帧级并行算法扩展性不够和负载不均衡的缺点,提出了一种基于任务队列模型的帧级并行编码算法。实验结果证明,此算法在四核平台上的加速比最高能达到3.9x,在信噪比和码率保持不变的基础上,提高了编码速度和CPU利用率,有效改善帧级并行算法的不足。最后,为了进一步提高编码速度,本文利用了Intel多媒体指令集SSE2和SSE4中的视频编码加速指令,分别实现了AVS视频编码的SIMD并行优化,并结合基于任务队列模型的帧级并行算法在Intel四核处理器平台上进行了测试。实验表明,Intel多媒体指令集对AVS视频编码速度的提升是非常显著的,尤其是最新的SSE4,与基于任务队列的帧级并行算法结合,加速比最高能达到14.8x。
其他文献
集成成像系统作为目前应用前景非常好的三维成像技术,可以形成全视差、全彩色的三维图像。不仅其系统结构简单,且无需佩戴光学辅助设备观看三维图像。然而,基于微透镜阵列的
打鼾是一种十分普遍的现象,大约有20%~40%的人群患有打鼾症状。打鼾不仅困扰患者、影响同伴,还会对患者健康造成威胁。阻塞性睡眠呼吸暂停综合症就是一种伴有打鼾的呼吸疾病,
能源已成为世界经济发展的关键问题,太阳能以其独特的特点——可再生和无污染,倍受人们关注。当前对于太阳能发电最大功率点跟踪(MPPT)的研究已涉及到许多的方向,其中有关于单轴
数字阵列雷达(DAR)是一种接收和发射都采用数字波束形成技术的数字化相控阵雷达,一方面,其具有系统资源调度和波束指向控制更加灵活,易于实现多功能和多任务;信号接收处理动态范
随着互联网技术的迅速发展,流媒体业务开始在世界范围内广泛推广和普及,用户对流媒体业务的需求也随之变的多样化,越来越多的用户希望流媒体业务能够突破空间和移动性的限制,
图模型是一种表示数据之间关系的常用手段。然而,传统的构建图模型的策略多是基于二元(成对)关系,并没有充分利用数据中隐藏的拓扑结构信息。本文针对非监督和有监督两种情况
随着信息技术的发展,通信网络技术在工业控制领域所起到的作用越发重要。工业控制领域中的诸多问题也随着通信网络技术的发展得以逐一解决。在这一领域中,以太网的引入带来了
高速发展的移动通信技术使得人们追求高传输速率和高可靠性的通信系统,而多输入多输出(MIMO, Multiple-Input Multiple-Output)技术通过收发端设置多根天线,在保证系统可靠传
随着全球信息化和计算机网络的飞速发展,各种应用对存储系统的容量和性能提出了越来越高的要求。在存储系统中,提高存储系统可靠性的技术主要体现在以下方面:廉价磁盘冗余阵
作为一种简单易用和高速的串行总线,USB(通用串行总线)从出现至今,越来越受到人们的欢迎。而随着OTG(On The Go)技术的推出,更加拓展了USB的应用领域。USB OTG设备具备双重角