论文部分内容阅读
基于图像序列的目标跟踪算法是计算机视觉的经典研究方向,目标跟踪特别是与人体相关的跟踪一直受到广大学者的亲睐。传统的跟踪算法都是基于短时间的跟踪,换句话说,它在跟踪失效后不能重新捕获目标,没有自学习能力,不能自适应目标外观的形变。由于人体目标自身具有的各种姿态变化并易受光照、遮挡、模糊等条件的干扰,这些使得跟踪算法在实际应用中面临着很大的挑战。 2009年的机器视觉国际会议(ICCV)英国萨里大学Z.Kalal博士提出了一种新颖的目标跟踪算法——TLD。该算法充分利用跟踪和检测的优点并将二者有效地结合起来解决跟踪过程中目标发生的姿态变化、遮挡等问题。同时,他引进了一种学习算法,在线更新目标模型,使得跟踪能自学习目标的变化。但是,该算法计算复杂度极高,对于一般的普通视频不能达到实时的要求。鉴于特定的跟踪人体以及TLD算法的启发,本文基于Kinect传感器进行研究,利用传感器提取人体骨架信息跟踪人体,并采用级联检测算法检测目标,最后对二者进行融合。为了使得跟踪能自适应目标外观的变化,本文引入了P-N在线学习机制,在线更新目标模型和级联检测算法的分类参数。当目标发生形变,姿态变化,特别是在当目标重新出现在视野中时,加入在线学习机制的级联检测方法能快速检测出目标。为了解决级联分类器算法在全图中搜索目标耗时这个问题,本文采用Kinect的深度信息预估计目标的大致位置,使得级联检测算法在预测位置的基础上搜索出目标,从而提高了检测的效率。 实验结果表明该算法在处理目标尺度放缩、复杂背景、部分遮挡、全局遮挡以及目标消失后重现等情况均有较强的鲁棒性,能实现复杂场景下运动人体的实时跟踪。