论文部分内容阅读
以高清数字视频为代表的数字多媒体技术的广泛应用,促进了视频压缩技术的发展。视频压缩技术的基本任务是在保证一定视频质量的条件下最大限度地减少视频存储(或传输)的比特数。本文在研究目前视频编码各种主要技术及MPEG-4、H.264和AVS等最新视频编码标准的基础上,提出一种基于矩阵空间划分的视频编码技术。
视频编码并非一个单一的算法,而是一整套的编码工具,这些工具综合起来实现完整的压缩效果。本文首先介绍当前主流的基于预测、变换的混合视频压缩编码的技术框架和相应的编码过程,并结合MPEG-4、H.264和AVS等标准中相关的内容进行分析。在此基础上提出基于矩阵空间划分的视频编码技术,其中矩阵空间划分的算法结合了运动估计和矢量量化的基本思想并引入了函数映射。这种编码处理的过程需要使用事先划分好的矩阵空间码书,计算码书的过程和编码时的矩阵匹配过程基本相同,只是需要遍历整个矩阵空间中所有矩阵。为了降低计算复杂度,从减少匹配次数的角度考虑,根据划分的集合大小不同的特点采取了排序的遍历,实验证明此方法可以减少约50%的码书计算时间。另外,由于对称性,减半的遍历过程也使码书计算时间减少约50%。编码是对原始视频进行标量量化和分块匹配,标量量化的目的是使像素值的取值范围映射到矩阵空间的元素取值范围。分块的方式可以单独一帧进行,也可以连续两帧(甚至更多)一起,后者更好地利用了像素间的时空相关性。分块匹配的数据通过熵统计计算出编码表示的平均码长并折算得到每个像素平均的编码比特数。另外,为了减小标量量化产生的误差,提高重建序列的主观质量,采用了以帧为单位的量化误差修正方案,这也可以看成一种滤波处理。实验表明这种方法对重建序列的PSNR有0.4~3.6dB的提高。