论文部分内容阅读
在人工智能日益火爆的今天,计算机视觉也变得越来越受人重视,而其中最为关键的一门研究方向就是立体视觉。在航天探测、医疗诊断、工业测量以及数字教育等多个领域立体视觉都有着广泛应用和发展空间。在立体视觉中最需要解决的问题是立体匹配算法的准确度和效率问题。快速、精确的立体匹配方法在应用立体视觉的各个领域中一直都是核心技术。所以不断优化和改进的立体匹配技术具有十分重要的价值。一个基本的立体视觉系统主要由图像采集,图像矫正,立体匹配和三维重建四个部分构成。最简单的双目立体视觉系统,首先对采集图像的双目相机进行标定,通过标定得到的参数对图像进行矫正,然后经过算法处理,得到对应的视差图。一般来讲,深度与视差存在一个反比的关系,所以可以根据视差图,恢复出关于场景的空间三维信息。本文主要搭建了一套完善的立体视觉系统,并通过基于多视点的裸眼3D显示设备完成了对模型的恢复重现。本文首先概述了相关的技术研究背景。包括了立体视觉在各个领域的应用情况,以及近些年来国内外对于这项技术的研究以及应用方向。然后对于整个立体视觉系统进行了原理性的分析。主要分为相机系统和立体匹配系统。对于相机系统,详细分析了相机的几何成像原理,空间坐标转换关系。采用matlab工具箱完成了相机对的标定工作,获取了相机系统的内、外参数,并完成了图像对的矫正工作。对于立体匹配系统,介绍了双目立体视觉系统的基本模型,阐明了深度与视差的关系以及立体匹配算法的基本框架。通过比较目前比较主流的两种局部立体匹配方法,自适应权值法和引导滤波法,优化了传统局部匹配算法的流程。本文针对图像滤波器在立体匹配算法中的应用,提出了将算法重心放在视差细化步骤上,简化前期运算复杂度的思路。在视差后处理中,以快速引导滤波器计算权值,并通过加权中值滤波的方法对视差图进行了优化处理,极大的提升了立体匹配算法的精确性和效率。根据匹配算法得到的视差图,本文采用了两种不同于以往DIBR技术的多视点扩展方法。一种是基于相位增强的视点扩展,通过对输入图像在频域上进行方向可控金字塔分解,将频谱图分解为不同大小不同方向的频域信息、,并计算得到输入的双视点图像在各个大小,各个方向上的差异。对差异的大小进行调整之后,再将金字塔进行融合恢复,就可以获得新的视点图像,这种方法无需进行视差图的计算,有利于实时系统的设计。另一种是基于傅立叶切片的视点扩展技术,首先通过视差图,恢复得到相关的三维信息,依据傅立叶投影变换关系,可以将三维模型进行傅立叶变换,然后在傅立叶面对频域进行某个切面的投影,通过对这个投影进行反傅立叶变换获取相应角度的新视点图像。