论文部分内容阅读
分布式视频编码(Distributed Video Coding, DVC)是以Slepian-Wolf理论与Wyner-Ziv (WZ)理论为基础的视频编码技术。相对于传统视频编码,分布式视频编码技术将编码端的复杂的预测技术转移到了解码端,特别适合编码能力受限的终端设备。为了获得更好的压缩效果,WZ帧经过编码之后只有校验位传输到解码端。由于缺少原始的WZ帧,解码端需要利用已解码的信息生成一个原始WZ帧的预测帧以辅助解码,该预测帧称为边信息(side information, SI)。边信息的准确程度将直接影响整个分布式视频编码系统的性能。近年来,在单视角DVC的研究中已存在有效的边信息生成方法,但是在多视角情况下仍缺乏较为有效的技术方案。本文在研究多视角分布式视频编码的理论基础上,重点研究多视角分布式视频编码中边信息的生成与融合问题,获得的研究结果如下:(1)针对现有的多视角分布式视频编码中空间边信息生成所存在的问题,提出了一种基于混合搜索与多重筛选的多视角分布式视频编码的空间边信息生成方法。该方法将特征匹配与极线搜索相结合来提高匹配的精度,再利用多重筛选的方法找出最优的定位结果。在相同码率的情况下,基于混合搜索与多重筛选的空间边信息生成方案的峰值信噪比(peak signal noise ratio, PSNR)相对于传统的视角预测视差补偿(disparity compensated view prediction, DCVP)最大提升1.65dB,最小也有0.64dB的提升,在不需要摄像机内部参数的情况下,能够达到与基于视角合成的视差预测技术(disparity based view synthesis, DBVS)相当的结果。(2)针对现有的多视角分布式视频编码中时间边信息与空间边信息融合方法中存在的问题,提出了基于置信度的时空边信息融合方法。利用时间上的前后帧与时间边信息,空间上的左右帧与空间边信息分别生成时间边信息可靠性模版与空间边信息可靠性模版,再利用时间上的运动矢量与空间上的视差向量生成像素级的时空置信度模版,综合分析后生成最终的时空边信息融合模版。相对于以时间边信息为主的融合方法和时间空间相互补偿的融合方法获得更高的率失真性能,能够更好的选择并保留时间边信息与空间边信息中有效的细节部分,提升解码帧的重构质量。