论文部分内容阅读
场景流估计是三维场景理解、场景动态重建等领域的重要一环,在计算机视觉领域逐渐引起人们的关注。然而,由于求解空间尺度较大,场景流一直受求解速度的影响,同时,多个子问题的联合求解将带来潜在的误差积累,影响场景流估计的整体精度。针对场景流求解精度低、速度慢的普遍现状,本文首先简单介绍了场景流求解的背景知识,并讨论了场景流与其他运动场的关联与不同。此后,本文根据传感器类型和场景流估计问题的建模和求解思想的差异,详细地分析了场景流求解方法的变化,对目前主流的方法进行了分类概括,并探讨了各类方法的优劣和特点。根据对场景流问题求解方案变化的整体把握,本文提出了基于运动分解的场景流估计求解策略。整个场景被分解为运动和非运动区域。在非运动物体区域,本文采用运动恢复结构(SFM)和即时定位与地图重建(SLAM)的思想进行相机运动求解,然后根据深度信息映射为稠密的三维运动场,极大地简化了计算量,并通过RANSAC剔除异常值和稀疏采样的思路优化系统的鲁棒性和计算效率。在运动物体区域,本文通过基于语义信息的三维测地距离(geodesic distance)改进了插值权重,并改进了稀疏-稠密的插值方法。通过一致性检验,本文将光流、视差估计初值中的异常点剔除作为待插值点,得到稠密精确的场景流估计。同时,本文对目前用于评估场景流估计方法的局限性进行了讨论,并介绍了通用的误差评估方法和常用公开数据集。为了验证方案的可靠性,本文首先对插值和相机估计两个问题进行了简单的方案验证。随后,本文通过误差定量分析进行了参数调节和方案设计,并在公开数据集以及真实场景下进行了定量的误差分析比对和定性的流场可视化分析。通过实验结果表明,本文提出的基于运动分解的场景流估计方法计算精度、效率都处于目前场景流估计方法的前列,拥有较好的场景流估计性能。