论文部分内容阅读
人的跟踪在人运动的视觉分析与理解中占有重要的地位,属于视觉的中级处理部分。人的跟踪是通过对摄像机所拍摄的视频图像序列进行处理,找出连续图像帧间的对应关系,实现对图像和图像序列中运动的人进行跟踪,给出其运动轨迹。利用人的跟踪,可以方便地获得人的运动、姿态、行为参数,为后续的高层的行为理解和识别奠定了基础。人的跟踪虽然是计算机视觉领域一个重要的研究方向和研究热点,但是目前仍然有很多理论与技术问题有待解决,特别是跟踪过程中遮挡问题的解决。
本文的工作以在视觉监控场景下鲁棒跟踪人体、解决遮挡问题为目标。在下面三个问题上进行了深入的探讨和分析:移动摄像机下基于主动轮廓的跟踪和遮挡处理、静止单摄像机下多目标的遮挡推理以及多摄像机下的人的跟踪。大量的实验表明我们方法的有效性和鲁棒性。论文的主要工作和贡献如下:
①我们通过引入一个马尔科夫随机场建模的惩罚因子来反映邻域内像素之间的关系,这样得到的轮廓在一定程度上能减少背景干扰和噪音的影响。而现有的大多数基于区域的主动轮廓方法在计算区域似然函数的时候通常假设区域内的像素是独立的。此外针对移动摄像机,提出了一个基于光流检测的轮廓初始化方法。
②在上一个工作的基础上,将颜色和形状结合起来,提出了一个分层的基于levelsets的跟踪框架用于处理刚体轮廓遮挡问题。首先在第一层,初始轮廓先根据颜色信息进化,惩罚因子用来度量像素之间的关系;然后,基于Mahalanobis距离的准则被用来判断是否要加入形状先验。如果需要形状先验,则第一层得到的轮廓会在已建立好的形状先验模型的约束下继续进化;否则,第一层得到的结果就作为最终的跟踪结果。在第二层轮廓进化中,本文作者提出了一个权重形状距离因子(WSDT)用来融合全局的形状信息和局部的颜色信息。形状先验模型建立在主成分分析(PCA)子空间并通过增量学习算法在线更新。
③针对非刚体周期性运动,提出了一个基于聚类的动态形状先验模型的跟踪框架。该框架分为离线训练和在线跟踪两个阶段。离线训练阶段,采用一个基于图理论的dominant set聚类方法学习出一个码本,其中每个码字代表一种特定的形状模式。然后构建一个码字转移矩阵用来刻画周期性运动物体轮廓在时序上的关系。在线跟踪阶段,本文作者将形状先验知识和当前图像的观测值融合起来,采用最大化后验概率(MAP)估计预测当前帧的形状模式。基于此动态形状模型和颜色特征,即使在有部分遮挡或背景干扰的情况下,也能较准确跟踪上目标的轮廓。
④本文作者提出了一个带有遮挡推理的多目标跟踪方法。该方法把遮挡关系作为隐状态融入整体的跟踪框架中,将带有遮挡关系推理的多人跟踪问题看作是最大化后验概率问题。遮挡关系的推导只由当前帧物体的状态、观测值和先验模型确定,而与前一帧的遮挡关系无关。先验模型包括人体二维椭圆形状模型、空间-颜色多高斯(SM0G)模型和匀速运动模型。采用粒子滤波算法实现了多人的跟踪与遮挡推理。
⑤提出了基于主轴的多摄像机匹配算法。利用不同视角下图像平面关于地平面的单映关系作为多摄像机匹配的几何约束,建立主轴匹配似然函数。相匹配的主轴对用来更新每个视角下人的脚点位置。即使人在每个视角下都被部分遮挡,本文作者的方法仍能准确定位每个视角下该人的位置。