论文部分内容阅读
随着数字视频技术的不断发展和广泛应用,传统的以二维图像为基础的视频画面已越来越难满足使用者的需求。因此人们更多的将研究重点转向了多视点、自由视点和三维等多种立体视频图像技术。多视点纹理加深度图像的表达方式具有复杂度低、虚拟视点渲染效果好的特点,并且能够很好地兼容二维视频设备,使得该技术具有广阔的应用前景。与此同时多视点视频信源数据太大,导致压缩、存储和传输过程都面临着不小的挑战,这也是多视点视频技术中的难点。因此,在硬件设备和信道容量依旧非常有限的前提下,视频编码码率控制就变得十分重要。本文紧扣码率控制原理,在编码优化的思想基础上进行了以下三个方面的研究:(1)研究模糊逻辑和模糊控制理论与算法。将模糊控制理论依据与多视点视频编码结构相结合,构造适用于多视点视频编码码率控制的模糊控制器,根据缓冲区码率输入输出的误差和编码参数之间的关系建立模糊控制模型。提出了一种基于模糊逻辑的多视点视频编码码率控制算法,在达到较好控制精度的同时也能得到一定的编码增益。(2)研究多视点编码时域率失真优化。在率失真理论的基础上,通过对时域传播链的研究,提出了多视点视频编码下的帧间时域传播链计算方法,采取为多个视点分别建立多条帧间时域传播链的方式构建时域失真传播模型,并将拉格朗日乘子用于编码控制中。在上诉研究的基础上提出了一种多视点时域率失真优化算法。(3)研究视频图像背景建模。为了解决海量监控数据的编码和存储问题,提出了一种基于可变块大小的背景建模算法。使用基于可变大小块的替换方式,根据计算块内残差和梯度进行替换分类检测与抉择,并再通过块的边界检测方式作进一步的替换选择。此外在背景建模算法的基础上,还提出了能使其性能最大化的全局长参考算法和自适应训练集长度算法。结合上诉三个方面的研究,论文提出了通用的多视点视频编码码率控制系统,可直接应用于目前各种主流视频编码标准。本文在码率控制和率失真优化方面的研究成果已集成至中国音视频编码标准AVS的3D视频编码器参考软件RFD中。作为标准的一部分,实现了MV和3D档次的精准码率控制和率失真优化。