论文部分内容阅读
随着信号处理技术和显示技术的发展,最初的黑白电视已经发展为彩色电视,彩色电视也由标准格式发展到高清制式。现在,三维电视(3DTV)因为其能带给人们身临其境的视觉感受,已经成为继数字高清电视之后新的研究和应用热点。任何3DTV系统的成功在很大程度上取决于是否存在大量生动有趣的三维视频资源,充足的三维视频内容可以使人们愿意购买3D显示器或3DTV系统服务,尤其是在3DTV普及的早期阶段。然而,录制大量新的三维视频内容需要高成本和一定的时间,这限制了3DTV系统的发展和普及。将现在已有的二维视频转换为三维视频不仅可以丰富三维视频资源,促进3DTV产业的发展,另一方面它还可以使人们以三维的形式重温经典的二维视频。2D-3D视频转换的一个关键问题是深度图的生成。深度图生成方法可分为人工、全自动和半自动三类:人工的方法生成的深度图具有很高的精确性,但是需要消耗大量的人力和时间成本;全自动的深度图生成方法精确度不高,但可以适用于实时的转换系统;半自动的深度图生成算法可以结合人工和全自动算法的优点。目前,还没有一种深度图生成方法能适用于所有的场景。而且,由于不精确的深度图产生的差的3D视觉效果还有可能会使观众感到眼睛疲劳和头疼。如何生成高质量的深度图是2D-3D视频转换需要解决的关键问题,深度图的生成方法可以不是实时的,可以针对某种特殊场景,也可以包含人工交互式的操作。本文分析了人眼立体视觉的基本原理,包括单目和双目立体视觉。在此基础上,研究了单幅图像的深度图生成方法,并提出一类基于线性透视和运动的深度图生成方法。具体内容概括如下:研究并通过仿真分析了利用边缘信息生成深度图的方法:根据图像的边缘信息将图像分割为不同的区域;利用图像的初始深度梯度假设为每一个分割区域分配深度值;最后对深度图进行双边滤波。对于聚焦图像,分别通过一种基于高阶统计量的方法和一种基于小波变换的方法提取出聚焦区域;把提取出的聚焦区域当作前景物体,并分别为前景和背景区域分配深度;最后进行深度融合,得到最后的深度图。提出了一类基于线性透视和运动的深度图生成方法。首先,重建场景的静止背景;其次,利用线性透视原理得到背景的深度层次图,分割出背景中的静止物体,并给静止物体分配深度值,进行背景的深度融合得到背景的深度图;然后分割出每一帧中的运动物体;最后,给运动物体分配深度值,并将运动物体的深度值融入背景深度图中,得到最后的深度图。总之,将图像或视频按照深度线索或场景进行分类,针对不同类型的图像或视频采用不同的处理方法,可以得到较高质量的深度图,这样生成的立体视频也会带给人们较为舒适的视觉享受。