论文部分内容阅读
从二维图像恢复三维空间可见表面的几何结构(称为三维重建)是人类视觉的主要目的,也是计算机视觉的重要研究内容和最终研究目标。摄像机标定是进行三维重建的关键一步,摄像机自标定技术通过图像本身的特征求解摄像机内参数,相对于传统的离线式摄像机标定技术,自标定技术是在线的,因此摄像机自标定技术具有相当大的理论研究价值与广阔的应用前景,摄像机自标定也成为90年代中后期在计算机视觉界兴起的最重要的研究方向之一。 本文对摄像机自标定及三维重建算法进行了积极的探索与深入研究。我们首先从基于模型的已标定单视图情况入手,通过建立深度矢量所在的零空间和目标模型矩阵的零空间之间的关系,提出了一个从目标单视图线性地精确重建其三维位姿的新算法,该算法只需要6个特征点即可实现目标三维位姿的线性重建(六点算法)。理论分析和实验数据表明,该算法具有快速高效、简单实用、抗噪能力较强的优点。然后,我们将六点算法推广到未标定单视图的三维重建。提出了基于模型的单视图线性自标定及三维重建算法,该算法继承了六点算法的优点,且可实现较为精确的摄像机自标定。为了获得更高的标定精度,我们整合利用摄像机获取的动目标视频图像中的多帧数据信息,将单视图算法推广到多视图算法,提出了基于模型的多视图线性自标定及三维重建算法,实验数据表明,该算法使标定精度得到了较大的提升,此外,我们给出了实现该算法的两种思路,并对这两种思路的算法实现分别做了实验及相应的实验结果比较分析。 我们知道,目前少有成功的多视图自标定技术,而且,已有的技术也限于特定摄像机运动模式下的线性自标定及三维重建,因此研究无运动模式约束的多视图自标定及三维重建技术具有相当大的理论与应用价值。在前述研究成果基础上,我们提出了多视图非线性自标定及三维重建算法。该算法在非线性实现部分引入了前述研究成果,并成功地实现了算法性能相对于线性算法的较大提升。此外,我们给出了实现该算法的两种思路,并对这两种思路的算法实现分别做了实验及相应的实验结果比较分析。 文章最后,我们将所提出的非线性算法应用于真实图像序列,并取得了满意的实验结果。同时我们也通过实验发现了多视图特征点进入或跑出视场的问题,对于这个问题我们提出了初步的策略,具体的改进算法将做进一步的研究。