3D视频编码中深度图的相关技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:w53839250
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着3D显示器和交互式多媒体系统的发展,新的3D视频应用,如三维电视(3DTV)和自由视点视频(FVV)已经越来越引起人们的兴趣。为了使这些3D视频应用成为可能,由多视点视频及其对应的深度图序列组成的新的3D视频格式(Multiview Video plus Depth,MVD)被提出。该视频格式利用基于深度图的视点合成技术(Depth Image Based Rendering,DIBR)可以合成任意位置的虚拟视点。如何对MVD数据进行高效的压缩是目前3D视频编码标准研究的一个重要问题。多视点视频在多视点视频编码标准(Multiview Video Coding,MVC)中已经进行了较详细的研究。本文主要对MVD中的深度图序列的编码和质量恢复进行了研究。深度图与传统的视频信息有很大的不同,深度图中的值表示的是场景中物体到摄像机的距离,它是由很有很多平滑区域构成,这些平滑区域由尖锐的边缘分隔开,而且这些边缘信息对视点合成非常敏感。此外,深度图不需要在终端呈现给用户进行观看,它主要是用来进行视点合成的。目前由于深度传感器物理上的限制,获取到的深度图通常具有很大程度的模糊和噪声,所以需要对深度图的质量进行复原。鉴于深度图的这些特性,本文提出了两项针对深度图编码的技术和一项针对深度图质量复原的技术。本文的主要工作和创新之处在于:1.提出了基于合成视点失真估计的深度图编码方法。本文充分分析了深度图编码对合成视点质量的影响,提出了用于深度图编码的失真模型。该失真模型用来估计深度编码对合成视点的影响。本文利用估计的合成视点失真来代替原有深度图失真进行RD最优化的模式决策过程。2.提出了基于视差的深度图编码方法。本文提出了对深度图对应的视差图进行编码来大幅度降低编码深度信息的码率,而对合成视点的质量没有较大的影响。该方法考虑了一种特殊的应用场合,即虚拟视点的位置在编码前已知。在目前的3D系统中虚拟视点的位置可以通过一个反馈网络得到,所以基于视差的深度图编码有着重要意义。3.提出了基于稀疏表示深度图恢复方法。该方法利用稀疏表示在图像逆问题中的重要作用,结合深度图像本身的一些先验知识:深度图中绝大部分区域是平滑的,深度图像中边缘与其对应的纹理图的边缘具有很强的相关性,对深度图进行恢复。
其他文献
心脏的收缩和舒张为人体的血液循环提供动力,是人体的动力之源,然而心血管疾病一直威胁着人类的健康。由于临床医学对人体心脏的研究成本高、效率低,虚拟心脏的研究得以迅速发展
无线传感器网络(WSNs)由大量传感器节点组成,这些节点分布在一定的区域内,并且通过无线节点间的相互通信来组成自组织的网络。无线传感器网络的主要功能是环境监测和信息采集,并
现在人们已经进入了信息化时代,并且随着科技的发展,信息在人们平时的生产和生活中变得越来越重要。这些信息以不同的方式出现在我们的生活中,如何将这些信息加以良好的有效的利
实验教学评价的研究是提高实验教学质量,进行科学实验教学管理的重要保证。针对当前实验教学评价系统存在的问题,设计开发了高校实验教学评价系统。本文主要工作内容如下: 
随着网络和数字媒体的快速发展,存在于网络上的视频数据呈现爆炸式增长,如何进行有效的管理和版权保护已引起了人们的广泛关注。基于内容的视频拷贝检测(Content-Based Copy De
语音作为一种方便、快捷、有效的交流方式,在人们的日常生活中扮演着非常重要的角色。随着社会科技的不断进步及其人工智能的迅猛发展,语音信号也逐渐成为人-机交互的一种重
随着无线网络和先进移动设备的迅速发展,移动环境下的个性化推荐服务已经引起了人们的广泛关注,在移动环境下要求实时性以及上下文感知的特性应用推荐场景已经有了很多广泛的研
移动Ad Hoc网络,是一类由若干移动通信设备构成的自组织系统。由于Ad Hoc网络中节点移动的随机性,使其拓扑变化频繁,造成网络性能下降,加之伴随各种应用的迅猛发展,人们对Ad Hoc网
当前各种互联网应用都面临着海量数据的存储和处理问题,飞速增长数据对数据处理系统的可扩展性提出了巨大的挑战。以MapReduce为典型的云技术的兴起,为海量数据的处理提供了一
语音情感识别研究是情感计算领域的一个重要组成部分,近年来越来越多的研究者和研究机构都投身于该领域的研究中。传统的基于快速傅里叶变换方法的情感特征提取不得不进行的一