基于分组统计及梯度结构相似度的AVS2帧内预测高效算法

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:yanchao0424
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
AVS2视频编码是我国第二代音视频编解码标准AVS2的第二部分,主要面向高清与超高清视频编解码应用。AVS2的视频压缩率是上一代标准的二倍,与HEVC的水平相当,并且引入了监控场景编码,3D视频编码等。AVS2视频编码在引用传统视频编码技术的基础上,引进了众多新颖的技术,但是也给编码器带来了较高的计算复杂度,导致编码器编码效率低下,不能满足实时编码的需要。因此,结合全I帧配置的项目背景,本文研究了 AVS2视频编码的关键技术,并提出了基于分组统计的帧内亮度预测模式快速选择算法和基于梯度结构相似度的编码单元快速判决算法。本文首先介绍经典的视频处理技术及国内外视频标准的发展过程,然后详细分析了 AVS2视频标准采用的关键技术,包括:帧内预测,帧间预测,逻辑单元划分,变换,量化,熵编码及环路滤波等。分析研究了 AVS2的帧内亮度预测算法及其在官方代码RD14.0中的实现方式,发现AVS2帧内亮度预测包含两个过程:粗略模式选择(Rough Model Decision, RMD)和率失真优化模式选择(Rate Distortion Optimization, RDO)。RMD主要完成从33种亮度预测模式中选出9种最佳预测模式,RDO过程主要是利用率失真优化的准则从9种预测模式中选择一种最佳的预测模式。针对RDO过程中候选模式较多,计算复杂度较高的情况,提出了一种基于分组统计的帧内预测模式快速选择算法。在该算法中依据帧内亮度预测模式预测方向的相似性,把33种预测模式划分为7个组。然后对经过RMD选出的9种模式在7个组内的分布情况进行统计,并利用MPMs的特殊性,从9种预测模式中筛选出几种模式进行RDO的计算,如此,达到降低计算复杂度,提高编码效率的目的。在帧内编码单元判决方面,研究发现AVS2的帧内编码单元判决过程采用了基于四叉树递归划分的方式,每个最大编码单元(Large Coding Unit, LCU)划分情况的判决过程都需要进行85次不同等级编码单元的率失真计算,计算复杂度较高。针对该部分提出了一种基于梯度结构相似度的编码单元快速判决算法。在该算法中,根据图像的空间相关性和梯度结构相似度能够有效分析出图像块差异性的特点,通过分析当前编码单元与相邻的左边或上边已编码单元的梯度结构相似度,并结合相邻的左边或上边已编码单元的大小来提前终止当前编码单元的向下划分,或跳过一些不必要大小的编码单元的率失真计算的目的。最后,对于本文提出的相关算法在官方代码RD14.0上实现,并进行了大量的实验验证。根据实现结果可以发现,本文提出的基于分组统计的帧内预测模式快速选择算法可以节省26.79%~32.82%的编码时间;本文提出的基于梯度结构相似度的编码单元快速判决算法,可以节省26.05%~28.45%的编码时间。
其他文献
本课题提出了一种有别于传统的电话集中交换模式,同时又有别于IP网络电话的,一种运行于宽带综合数据光同步网之上的无交换中心电话系统。它真正体现了业务与呼叫控制相分离,呼叫
当今,电子视频监测系统被广泛应用于交通监控与调度、楼宇内外环境安全监控及银行系统的安全保障等领域。在安全监控应用中,基于图像序列的人脸识别往往是动态图像识别,其特点是
双基地高频地波雷达海面目标检测的主要影响因素是海杂波,慢速舰船目标会被强海杂波遮蔽,从而无法检测到目标。因此,海杂波特性分析和抑制方法是高频地波雷达研究和发展的一个重
锥束CT利用平板探测器获取物体的二维投影,而物体断层图像则是利用三维重建的方式获得。相对于传统二维CT来讲,这种方式不仅扫描的速度比较快,与此同时,它还具有射线利用率高等多