论文部分内容阅读
视觉跟踪,是一个根据给定外观模型在图像序列中定位目标的实时系统。作为最重要的计算机视觉任务之一,视觉跟踪有着广泛的应用领域,包括交通、导航、生态、安防、军事、体育、机器人等。尽管研究视觉跟踪的算法种类繁多,模拟人类视觉机制并达到与人类视觉相媲美的视觉跟踪系统依然是充满挑战而又有前途的研究课题。本文从生物视觉的角度出发,提出两个新的视觉跟踪算法。第一个算法根据压缩感知理论,将稀疏表示应用于Lucas-Kanade图像配准框架。目标的外观模型由过完备字典的稀疏表示。通过最小化校准误差的1范数来求解目标的状态参数,从而实现对目标的准确跟踪。目标的过完备字典可以用每一帧的跟踪结果在线更新。为了解决由于动态字典不断更新造成的跟踪漂移问题,采用两阶段迭代机制。第一阶段采用动态字典来搜索目标,而第二阶段则在第一阶段得出的结果附近采用静态模板再一次搜索。通过仿真实验,说明本算法具有速度快,跟踪长视频鲁棒性高的特点。算法一尽管有很好的跟踪效果,但不能反映人类跟踪目标的全部。因为人在跟踪目标的时候不仅仅是匹配目标的特征,还有着强大的识别能力。为了模拟人类视觉机制,本文提出了第二个视觉跟踪算法BIOT。该算法使用了生物激励模型(BIM)来表示目标外观,提出一个完整的BIM模拟视觉皮质机制,包括初级视觉皮质和高级视觉皮质。利用来自初级视觉皮质的子块特征搜索目标的位置;并且使用SVM分类器模拟高级视觉皮质能够很好的区分目标和背景。为了克服抽取BIM特征时带来的巨大时间开销,本文提出适用于BIM的迭代搜索算法,使得BIM提取次数大大的减少。大量的对比实验结果表明我们的算法对于光照变化、目标遮挡和外观变化是稳健的,优于其他对比算法。