论文部分内容阅读
随着人们生活质量的提高,图像与视频的清晰程度也越来越高。同时,随着硬件技术发展的日新月异,使图像与视频的一个新的发展方向,即从二维平面显示过渡到三维立体显示,逐渐受到学术界的关注。本文从介绍三维视频的背景与发展开始,逐渐引入了目前三维视频显示技术的最新概念。目前,自动立体显示技术已经作为一种全新的应用,在三维视频市场领域有了一席之地。其中飞利浦公司基于二维视频+深度图格式的三维显示器具有很大的应用前景。因此本文将二维视频+深度图格式作为三维视频格式发展的主要基础,详细论述了在不需要将整个产业链全部推倒重来的情况下,如何仅仅从单目视频序列中获取图像的相对深度信息,即从二维视频转换为三维视频。这一研究方向是一个全新的领域,同时也能为三维视频的发展提供一些前瞻性的思路。本文基于对人眼视觉特性的分析,利用人眼对三维世界感知的几个主要线索,提出了三种获得场景相对深度信息的方法。第一,利用物体边缘常被人眼识别为深度不连续区域的特性,将物体的边缘赋予前景的深度,从而启发我们通过彩色边缘信息获取相对深度信息。文中提出了一种四元Sobel滤波器的彩色边缘提取方法,对传统的灰度边缘提取方法在四元数域中的拓展作了初步尝试。结果显示,该方法能够针对深度图的分布特性较好地区分前景和背景。第二,利用人眼往往将显著的运动物体识别为前景物体的特性,本文提出了一种基于四元Gabor小波的运动估计方法,藉由立体视频序列中物体的运动状态获得相对深度信息。同时采取了基于GraphCut的物体分割手段和金字塔式的匹配结构,进一步提高运动场的精确度。第三,基于飞利浦公司所提的Gravity Cue1思想(人眼将靠近视频图像下方的物体识别为前景的因素),对深度分布信息进行从图像上方到下方依次由远及近的优化。最后,本文在三种深度信息获取手段的基础之上,根据各种深度信息的置信程度,进行加权处理,获得符合人眼视觉特性的相对深度显示。二维单目视频转换成三维视频不仅是一个全新的领域,更是一个较难的研究课题。它以计算机视觉及人眼视觉特性为基础,同时需要综合各种图像及视频处理的方法。本文在该新兴领域内提出了创新性的见解,并且通过实验证明了二维单目视频转换成基于深度图格式的三维视频的可行性,取得了较为满意的结果。