论文部分内容阅读
随着3D显示器和交互式多媒体系统的发展,新的3D视频应用,如三维电视(3DTV)和自由视点视频(FVV)已经越来越引起人们的兴趣。为了使这些3D视频应用成为可能,由多视点视频及其对应的深度图序列组成的新的3D视频格式(Multiview Video plus Depth,MVD)被提出。该视频格式利用基于深度图的视点合成技术(Depth Image Based Rendering,DIBR)可以合成任意位置的虚拟视点。如何对MVD数据进行高效的压缩是目前3D视频编码标准研究的一个重要问题。多视点视频在多视点视频编码标准(Multiview Video Coding,MVC)中已经进行了较详细的研究。本文主要对MVD中的深度图序列的编码和质量恢复进行了研究。深度图与传统的视频信息有很大的不同,深度图中的值表示的是场景中物体到摄像机的距离,它是由很有很多平滑区域构成,这些平滑区域由尖锐的边缘分隔开,而且这些边缘信息对视点合成非常敏感。此外,深度图不需要在终端呈现给用户进行观看,它主要是用来进行视点合成的。目前由于深度传感器物理上的限制,获取到的深度图通常具有很大程度的模糊和噪声,所以需要对深度图的质量进行复原。鉴于深度图的这些特性,本文提出了两项针对深度图编码的技术和一项针对深度图质量复原的技术。本文的主要工作和创新之处在于:1.提出了基于合成视点失真估计的深度图编码方法。本文充分分析了深度图编码对合成视点质量的影响,提出了用于深度图编码的失真模型。该失真模型用来估计深度编码对合成视点的影响。本文利用估计的合成视点失真来代替原有深度图失真进行RD最优化的模式决策过程。2.提出了基于视差的深度图编码方法。本文提出了对深度图对应的视差图进行编码来大幅度降低编码深度信息的码率,而对合成视点的质量没有较大的影响。该方法考虑了一种特殊的应用场合,即虚拟视点的位置在编码前已知。在目前的3D系统中虚拟视点的位置可以通过一个反馈网络得到,所以基于视差的深度图编码有着重要意义。3.提出了基于稀疏表示深度图恢复方法。该方法利用稀疏表示在图像逆问题中的重要作用,结合深度图像本身的一些先验知识:深度图中绝大部分区域是平滑的,深度图像中边缘与其对应的纹理图的边缘具有很强的相关性,对深度图进行恢复。