论文部分内容阅读
近些年来,随着3D显示技术的快速发展,3D显示设备、3D视频得到了迅速普及。3D视频由于其立体视觉效果提升了人们的视觉体验,受到了广泛欢迎。然而,3D视频内容的短缺制约着3D显示技术的进一步发展。2D转3D技术能够将现有的2D视频内容转换成3D视频内容,因而获得广泛的研究。在2D转3D中,根据已知的2D视图估计出相应的深度图是其中的关键步骤。深度传播技术作为半自动2D转3D中一项重要技术,近些年来获得了大量的应用和深入的研究。深度传播技术的主要依据是视频帧之间的相关性。首先,选取视频序列中的特定帧为关键帧,关键帧的深度值预先人工设定或者已知,然后根据视频之间的相关性获得非关键帧的深度图,从而得到整个视频的深度图。深度传播技术的应用使2D转3D在较少人工参与的情况下,就能获得较好的深度图质量。现有的深度传播算法可以分为四类,主要有基于运动估计和双边带滤波器的方法、基于优化建模的方法、基于图像分割的方法以及基于机器学习的方法。现有的深度传播算法在深度估计中已经取得了很好的效果,但是依然存在块效应、模糊等问题,生成的深度图质量有待提高。得益于3D显示技术的发展,多视点显示技术也逐渐发展并且提高了用户的视觉体验。然而,多视点显示技术带来的数据量的增加使多视点视频显示内容的压缩、存储和传输面临一个挑战。在常见的多视点视频编码系统,也就是常说的3DV系统中,需要对多个视点的彩色视图和深度图进行编码,这就对编码效率和传输带宽产生了很高的要求。在近些年来产生的多视点视频编码标准中,各种视频编码技术得到了应用和拓展。论文的主要工作有:(1)针对现有的深度传播算法存在的缺陷,论文提出了一种基于自适应运动估计的深度传播算法。该算法的主要思路是对于场景中的不同区域自适应采取不同的运动估计方法。对于背景区域,深度较为平滑,采用双向可重叠块的运动补偿方法,通过计算绝对误差和值来选择准确的运动向量进行运动补偿。对于深度信息丰富的前景区域以及背景区域中运动向量估计不准确的像素点,采用基于光流场的运动估计方法。该算法能够适用于场景复杂多变的情况,使生成的深度图具有更好的质量。(2)针对多视点显示技术带来的传输数据量的增加的问题,提出了一种基于视点间深度传播技术的视点间深度图生成方法。将其应用于3DV系统多视点视频深度图编码中,可以节省传输带宽。该算法主要包括视点间深度传播、三维图像变换、深度值优选三个部分。利用该方法,除了正常编码传输所有视点的纹理视图,仅仅需要传输少量关键视点的深度图以及非关键视点对应的二值矩阵就可以在解码端获得所有视点的深度图。实验结果表明,利用该方法获得的深度图的质量与正常编解码重建获得的深度图质量相类似,同时大大减少了深度图编码传输的带宽。