论文部分内容阅读
AVS2视频编码是我国第二代音视频编解码标准AVS2的第二部分,主要面向高清与超高清视频编解码应用。AVS2的视频压缩率是上一代标准的二倍,与HEVC的水平相当,并且引入了监控场景编码,3D视频编码等。AVS2视频编码在引用传统视频编码技术的基础上,引进了众多新颖的技术,但是也给编码器带来了较高的计算复杂度,导致编码器编码效率低下,不能满足实时编码的需要。因此,结合全I帧配置的项目背景,本文研究了 AVS2视频编码的关键技术,并提出了基于分组统计的帧内亮度预测模式快速选择算法和基于梯度结构相似度的编码单元快速判决算法。本文首先介绍经典的视频处理技术及国内外视频标准的发展过程,然后详细分析了 AVS2视频标准采用的关键技术,包括:帧内预测,帧间预测,逻辑单元划分,变换,量化,熵编码及环路滤波等。分析研究了 AVS2的帧内亮度预测算法及其在官方代码RD14.0中的实现方式,发现AVS2帧内亮度预测包含两个过程:粗略模式选择(Rough Model Decision, RMD)和率失真优化模式选择(Rate Distortion Optimization, RDO)。RMD主要完成从33种亮度预测模式中选出9种最佳预测模式,RDO过程主要是利用率失真优化的准则从9种预测模式中选择一种最佳的预测模式。针对RDO过程中候选模式较多,计算复杂度较高的情况,提出了一种基于分组统计的帧内预测模式快速选择算法。在该算法中依据帧内亮度预测模式预测方向的相似性,把33种预测模式划分为7个组。然后对经过RMD选出的9种模式在7个组内的分布情况进行统计,并利用MPMs的特殊性,从9种预测模式中筛选出几种模式进行RDO的计算,如此,达到降低计算复杂度,提高编码效率的目的。在帧内编码单元判决方面,研究发现AVS2的帧内编码单元判决过程采用了基于四叉树递归划分的方式,每个最大编码单元(Large Coding Unit, LCU)划分情况的判决过程都需要进行85次不同等级编码单元的率失真计算,计算复杂度较高。针对该部分提出了一种基于梯度结构相似度的编码单元快速判决算法。在该算法中,根据图像的空间相关性和梯度结构相似度能够有效分析出图像块差异性的特点,通过分析当前编码单元与相邻的左边或上边已编码单元的梯度结构相似度,并结合相邻的左边或上边已编码单元的大小来提前终止当前编码单元的向下划分,或跳过一些不必要大小的编码单元的率失真计算的目的。最后,对于本文提出的相关算法在官方代码RD14.0上实现,并进行了大量的实验验证。根据实现结果可以发现,本文提出的基于分组统计的帧内预测模式快速选择算法可以节省26.79%~32.82%的编码时间;本文提出的基于梯度结构相似度的编码单元快速判决算法,可以节省26.05%~28.45%的编码时间。