论文部分内容阅读
我们所处的世界是复杂多变的,而在人类认识世界的过程中,绝大部分信息来之于视觉。随着计算机技术和传感器的快速发展,机器视觉成为人类实现自动采集数据的重要组成部分。而在视觉领域,运动的物体相比于静止的物体,包含了更多的信息,运动流场成为了从底层信息到高层图像分析的桥梁。2维光流描述的是运动物体表面亮度模式的变化,场景流描述的是3维动态场景,可以看作是光流在3维空间中的扩展。 流场估计是一个病态问题,其求解需要在变分框架中附加多种假设使得求解正则化。由于变分模型能将流场的估计问题转化成极值求解问题,在流场估计中表现出了巨大的优势,本文从双目立体图像序列中获取信息,构建场景流估计的变分模型。数据项结合图像序列时间和空间的关系,采用亮度和梯度相结合的恒常假设,增强算法的鲁棒性,在数据项的每个分量上,采用遮挡因子加权的方式处理遮挡问题。平滑项是变分法求解流场的重要组成部分,通过施加对求解变量的惩罚,实现对模型的约束求解。本论文提出了一种自适应各向异性流场驱动的场景流估计方法,在各向同性流场驱动的平滑项中,流场的每个方向分量上,扩散系数相同,且为依赖于流场模值的标量函数,对流场平滑缺乏方向性,本文在此基础上提出了各向异性场景流平滑,提高了运动边缘处的估计精度与可靠性。由于全变分模型对流场进行平滑处理后会出现“阶梯现象”,本文通过对其进行自适应加权,提出了自适应各向异性流驱动的模型。对于场景流模型求解中存在的大位移问题,本文改进了由粗及精的多分辨率求解方案,将粗分辨率层求出的值传递到细分辨率层,先利用变形手段对前一帧图像进行变化,再计算变形图像和后一帧图像的残差,从而克服大位移问题。在图像金字塔的每一层,场景流通过超松弛迭代(SOR)求解。 最后本文用Middlebury网站上的Cones,Venus和Teddy数据集、hemi-spheres数据集和实验室采集到的真实场景图像序列验证算法的有效性。