论文部分内容阅读
近些年来,随着计算机技术和数字化产品的迅猛发展,对计算机视觉的研究也正得到人们越来越多的关注。作为计算机视觉的主要研究方向之一,摄像机标定是二维数字图像恢复和重建物体三维空间特征的基础和必经步骤。现有的摄像机标定技术包括传统方法、基于主动视觉的方法和摄像机自标定方法。传统方法需要形状等几何信息已知的标定物作为参考,很难在实际中应用;基于主动视觉的方法需要利用摄像机做特定运动的特殊性来实现标定,对实验系统的精度要求较高;基于自标定的方法虽然对标定场景和标定仪器要求不高,但往往鲁棒性较差,精确度不高。为此,本文研究了三焦点张量的估计算法并提出了一种基于三焦点张量的摄像机自标定方法,所做的具体工作如下:首先,对计算机视觉的基本理论做了简单的概括。主要对摄像机成像几何模型及多视图几何关系进行了描述,摄像机成像几何模型包括线性模型和非线性模型,其中线性模型实现比较简单,而非线性模型可以较好地模拟和补偿摄像机的各种像差,但往往计算复杂度高,实现起来相对比较困难。其次,研究了对极几何中的基本矩阵估计算法。基本矩阵代表了两幅视图之间不以具体场景为转移的对极几何关系,通过基于灰度相关性的角点匹配算法得到初始的匹配点对,在此基础上再在利用RANSAC算法估计基本矩阵,同时得到了两幅图像之间的精确匹配点对。再次,在详细研究现有多种三焦点张量的估计算法的基础之上,提出了一种基于遗传算法和LM算法的三焦点张量估计算法。现有三焦点张量估计算法包括直接线性求解的方法、迭代算法和RANSAC算法。直接线性算法计算比较简单,但是不易取得最优解,迭代算法复杂度高且依赖于初值的选取,RANSAC算法鲁棒性较高,但是阈值的选取不易确定。而本文所提出的三焦点张量估计算法充分利用了遗传算法全局搜索能力强和LM算法迭代下降速度快的优点,实验结果表明这种方法虽然增加了计算复杂度,但是所得结果比较精确。最后,提出了基于三焦点张量的摄像机标定方法,这种标定方法属于基于绝对对偶二次曲面的摄像机自标定方法的范畴,与一般自标定方法不同的是,利用三焦点张量可以获得同一参考坐标系下的三个摄像机投影矩阵,且最后利用对非线性方程组进行线性化的处理对初始结果进行了迭代优化,获得了更为准确的摄像机内参数。实验结果表明该自标定方法是正确有效的。