论文部分内容阅读
随着近几十年来信息技术的发展,社会的信息化程度在不断地提高,人们对视频信息的需求也越来越迫切。数字视频的应用领域和使用范围越来越广泛,视频编码技术受到了前所未有的重视。MPEG-1/2标准的制定使数字视频走进了千家万户,但是随着计算机技术、网络技术、数字技术、无线技术和视频编码技术的不断发展,人们已经不再满足于被动地接受多媒体信息,而期望更多的交互性。针对视频编码技术的发展,MPEG组织制定了MPEG-4国际标准,提供对任意形状视频对象的编码功能。MPEG-4基于对象的视频编码是实现基于内容交互功能的关键。为了实现MPEG-4基于对象的视频编码的实际应用,编码效率和实时编码技术是很关键的研究领域。
在表达视频对象时,处在对象外的透明部分是没有定义的,当进行视频对象编码时必须对其进行填充,以提高压缩编码的效率。在第二章中,首先简要介绍了MPEG-4基于对象的视频编码的基本概念,然后在讨论了现有的基于宏块的重复填充算法和线性外插填充算法的基础上,提出了一种扩展平均填充算法,用于填充重建的视频对象平面(VideoObjectPlane,VOP)以外的透明部分。与现有的填充算法相比,扩展平均填充算法更加充分地利用了VOP边界象素信息,提高了填充值的精度;该算法并不区分水平或者垂直方向的填充,更符合对象运动方向的随机性;该算法用VOP内象素的均值来填充远离VOP边界的透明区域,使不透明区域到透明区域的过渡更加平滑。仿真结果表明,扩展平均填充算法在编码效率(峰值信噪比和编码比特的压缩率)方面优于现有的填充算法:与基于宏块的重复填充算法和线性外插填充算法相比,该算法的PSNR分别提高了0.1~0.2db和0.15~0.35db,编码比特压缩率分别提高了2~5﹪和2~6﹪。
形状编码是MPEG-4基于对象的视频编码的关键。在MPEG-4中,形状编码的核心算法是基于上下文的算术编码(CAE)。当进行帧间形状编码时,为了提高CAE的编码效率,必须对编码的形状信息进行形状运动估计。为了实现实时的形状编码,必须对形状运动估计算法进行优化。第三章首先简要介绍了MPEG-4中形状编码的基本概念,然后在讨论了MPEG-4验证模型中形状运动估计算法、基于内在特性的形状快速运动估计算法、基于边界象素的形状快速运动估计算法的基础上,本文提出了一种基于对象边缘的形状快速运动估计算法。与现有的三种形状运动估计算法相比,基于对象边缘的形状快速运动估计算法更加充分地利用了邻近形状块之间形状运动向量的相关性,提高了形状运动向量预测值的精度;该算法还充分利用了形状运动估计时的边界特性——这也是该算法的核心思想,把搜索区域设定在VOP的边界附近,大大提高了形状运动估计的速度,而边界形状块的匹配精度并不会有明显的下降。仿真结果表明,基于对象边缘的形状快速运动估计算法的形状运动估计速度大大超过现有算法的形状运动估计速度,其平均搜索点数只有MPEG-4验证模型中算法搜索点数的0.82﹪,而形状的编码效率并没有降低。
为了实现视频对象的实时纹理编码,必须对纹理运动估计算法进行优化。第四章首先简要介绍了MPEG-4中视频对象边界纹理的多边形匹配方法,然后在讨论了新三步搜索算法、四步搜索算法、基于块的梯度降低搜索算法、钻石搜索算法的基础上,本文提出了一种基于对象的纹理快速运动估计算法。与现有的四种纹理快速运动估计算法相比,基于对象的纹理快速运动估计算法充分利用了视频对象的形状信息与对象边缘宏块的匹配特性——这也是该算法的核心思想,从而大大提高了边界纹理宏块的运动估计速度;该算法还充分利用了对象内部宏块运动的相关性,不仅避免了运动估计时匹配误差陷入局部最小点,而且提高了运动估计的速度;另外,该算法还充分利用了纹理宏块的编码特性,通过两个中断运动估计过程的判决方法来进一步提高运动估计的速度。仿真结果表明,基于对象的纹理快速运动估计算法的运动估计速度比其它算法的运动估计速度快,其平均的搜索点数只有全局搜索算法(FS)搜索点数的0.57﹪,而匹配误差保持相近。另外,该算法与其它纹理快速运动估计算法在技术上是互补的,因此最佳的运行方式是联合其它的纹理快速运动估计算法,以进一步提高运动估计的速度——能够和其它快速运动估计算法联合运行是该算法的一个优点。
为了能在PC上实时运行MPEG-4的CoreProfile@Level2视频编解码器,必须对其进行优化。第五章首先介绍了MPEG-4基于对象的形状编码、运动估计与补偿、纹理编码以及相应的解码方法,然后对基于PC的软件视频编解码器进行了全面的优化,本文提出了对MPEG-4基于对象的视频编解码器的优化算法,大大提高了编解码的速度,并降低了内存需求。仿真结果表明,经过优化的视频编解码器的编解码速度大大提高,可以实现CIF(352×288)格式的序列每秒25~30帧的快速编码以及每秒30帧以上的实时解码,这充分说明本文的优化方案是可行的。本文的优化方案对实现各种应用条件下的MPEG-4编解码器具有重要的参考价值。