论文部分内容阅读
视频压缩是各种视频服务得以实现的前提,原始的视频数据一般通过编码器压缩以降低传输成本与存储代价;在视频处理过程中,压缩后的数据通过相应的解码器转换成原始视频。目前最新的视频编解码标准一高效视频编码标准(HEVC,也称为H.265),是由国际电信联盟(ITU-T)和国际标准化组织及国际电工委员会(ISO/IEC)成立的视频编码联合工作组(JCT-VC)于2010开始制定并于2013年初公布的。虽然沿用了与以往H.264/AVC相似的混合视频编码框架,但H.265/HEVC在各关键环节采用了许多新技术和编码工具,不仅提升了图像的视觉质量,同时也提高了视频的压缩率。根据实验统计,相比于目前应用最广泛的H.264/AVC, H.265/HEVC在保证相同的画面质量下,能够降低大约50%的比特率。随着数字视频不断向高分辨率、高帧率和高压缩率发展,巨大的编码优势将使H.265/HEVC在不远的将来成为数字视频产业的首选编解码标准。H.265/HEVC标准是在H.264/AVC标准的基础上发展起来的,但是在压缩效率、并行处理能力以及网络适应性等方面有了极大的提高。可是压缩率的提高也导致了计算复杂度的大幅度增加,据测试,H.265/HEVC的计算复杂度是H.264/AVC的2至4倍。高昂的计算代价将限制新标准在监控系统、便携移动设备等领域的推广和应用。因此,如何提高H.265/HEV C的编码速度,降低计算复杂度成为目前众多企业和科研单位研究的重点。本文针对该问题,分别从帧内编码、帧间编码和并行编码三个方面对H.265/HEVC进行了必要的改进。具体地:1.帧内预测编码的改进:帧内预测编码是H.265/HEVC不可或缺的关键技术,其利用图像本身的信息消除空间冗余,但是复杂的编码单元(CU)划分和帧内预测模式选择给帧内编码带来了巨大的计算量。因此,为了达到降低计算复杂度的目的,我们设计并实现了多种帧内CU划分的快速决策算法:1)方法一根据对图像空间相关性的统计分析,将CU分为三类:然后通过参考相邻CU的尺寸,并结合亮度方差的比较,快速确定CU的划分方式。2)第二种方案将图像的亮度分布和局部的率失真(RD)代价相结合,首先通过直方图分析像素的亮度分布,确定图像的编码尺寸范围,然后在帧内编码过程中,通过统计相邻空间区域不同编码尺寸下的RD代价,得到CU划分的阂值,并根据当前CU的RD代价和相应阈值的比较确定是否提前终止CU划分。3)方法三将图像特征点的分布同局部RD代价相结合,通过支持向量机(SVM)分类确定不同图像区域的编码尺寸范围,进而利用与方法二相同的RD代价信息实现CU划分的提前终止。2.帧间预测编码的改进:帧间预测在整个编码中占据了60%-70%的时间,是影响编码速度的关键,也是目前研究的重点。我们在本文中提出两种帧间编码的加速算法。第一种为基于RD代价的快速帧间预测算法,分别为不同深度的CU选择不同的阈值,通过阈值比较避免不必要的CU划分,从而实现编码加速。首先根据参考图像中最佳编码尺寸为64×64的CU的RD代价,判断当前图像深度为0的最大编码单元(LCU)是否继续划分;如果继续划分,对于低层的子单元,则根据同一编码树单元(CTU)中与其深度相同的已知CU的RD代价来判断是否继续划分。该方法通过提前终止CU的划分达到降低计算量的目的。第二种为基于预测残差分析的帧间加速算法,首先对H.265/HEVC的编码树结构中位于根节点的编码树块,我们根据拉格朗日因子自适应地选择合适的分割阈值,然后利用Sobel算子对亮度预测残差进行边缘检测,并基于边缘的统计信息确定是否对LCU进行划分;对于编码树其他节点的CU,我们将CU的划分分为三类,并根据相应块区域的预测残差的离散度与阈值的比较选择合适的划分,其中该阈值通过对不同编码视频和不同拉格朗日因子的统计计算得到。基于对预测残差的分析,为不同深度的CU选择对应的判断依据,从而实现帧间预测速度的提升。3.监控视频的编码改进:视频监控是目前最常见的视频应用之一。本文根据监控视频中相邻图像相似度高的特性,设计了一种基于帧间差图像的编码方案,并根据帧间差图像的亮度信息提出一种CU的快速划分算法,通过利用帧间差图像的亮度信息,能够自动将运动物体从背景中分离出来,并且为不同区域自适应地选择合适的CU尺寸。实验结果证明,针对监控视频,本文提出的方法,相比于HEVC标准测试模型,以损失极小的比特率为代价,能够降低大约45%的计算复杂度,而且能够保持视频编码的质量;同时本文的方法不仅适用于静止摄像头拍摄的监控视频,对于一般视频也能取得不错的编码效果。4.并行编码优化:并行编码是提高编码速度行之有效的手段。但是根据实验统计和分析,发现负载不均衡限制了编码速度的进一步提高。因此,针对H.265/HEVC Slice级并行编码效率低的问题,我们提出了两种改进方式。一是考虑到视频中相邻两帧图像相似度高,所以本文根据对已编码图像中CTU编码时间的统计,提出一种参考前帧预测的方法(RFP)实现待编码图像的Slice中CTU的均衡分配;二是在RFP方法的基础上提出了参考帧加权组合预测方法(WCP),通过参考已编码帧的信息并结合图像组(GOP)结构中图像的不同编码模式和参考关系,将视频图像分为三类,在不同的类中分别通过已编码图像信息的加权组合计算实现图像中Slice的负载均衡,有效地解决了Slice中CTU分配不均的问题,从而达到提高并行效率的目的。综上,在本文中,相对于HEVC标准模型,我们的改进算法对视频的时间相关性,空间相关性以及统计相关性的利用和发掘更加充分,也更加深入。针对帧内编码、帧间编码以及并行编码的改进都取得了非常积极的效果,在保证重构视频的视觉质量的前提下,以损失极小的编码率为代价,显著地缩短了编码时间,有效地降低了H.265/HEVC编码的计算复杂度。