论文部分内容阅读
目标跟踪作为计算机视觉的一项重要研究内容,广泛地应用于智能监控、视觉导航、智能交通、人机交互、远程视频会议、运动分析等领域[1]。目标跟踪可以理解为在已知目标先验信息的条件下,在视频序列中持续的发现目标位置、大小、形态等运动状态信息的过程[2]。作为计算机视觉领域的一大难点,国内外诸多学者已经提出了诸多行之有效的目标跟踪算法。但在实际应用中,目标跟踪仍面临着许多亟待解决的难点,如目标遮挡、复杂背景、相似目标干扰、目标形态变化、光照变化等问题。这些问题的存在,严重制约着传统目标跟踪算法的发展和使用[3,4]。近年来,随着目标检测和机器学习的蓬勃发展,有越来越多的学者将目光投向了融合目标检测的目标跟踪(Tracking by Detection)。提出了一系列优秀的目标跟踪算法,如Struck、TLD、SCM等,使得基于检测的目标跟踪算法逐渐发展为主流[4-8]。本文以视频目标跟踪为研究重点,着重研究了当前主流的基于检测的目标跟踪算法之一的TLD目标跟踪算法。该算法在框架上可大致分为三个模块:短时跟踪模块、检测器模块、学习器模块[9]。TLD算法与传统算法的主要区别就在于将跟踪和检测相结合,引入了在线学习机制,成功解决了目标丢失后重新获取,长时间跟踪等问题。量化评估表明,该算法性能优于现有的大多数跟踪算法[10,11]。然而,TLD算法并非完美,当面临目标遮挡、外形变化、光照及对比度变化、相似背景等干扰时,TLD算法仍会大机率地跟踪失败。在学习分析TLD目标跟踪、角点检测、机器学习等理论的基础上,本文分析并提出了算法存在的几点问题缺陷。针对所存在的问题,提出并实现了几种基于TLD目标跟踪算法的改进算法。论文的主要工作如下:(1)提出了一种基于角点增强改进的TLD目标跟踪算法。针对原算法中无法有效表示目标特征的问题,结合角点检测理论,引入了基于角点检测的跟踪算法。提出使用具有对光照及对比度不敏感、具有旋转不变性的角点作为短时跟踪器的特征点,确保目标的关键点能够被稳定的跟踪,抑制因跟踪平滑点和背景错误特征点而导致的跟踪结果漂移现象,提高跟踪的稳定性。实验表明,改进算法有更好的抗漂移,抗旋转效果,鲁棒性较原算法更强,达到预期效果。(2)提出了一种引入在线模板删除机制的TLD算法。针对算法中随着跟踪进行,在线模板积累造成的降低实时性、降低稳定性问题,设计并实现了一种依据目标和模板相似度为依据的模板删除机制。该机制在模板积累到一定数量时,会判断并删除早期相似度较低的模板。实验表明,引入了在线模板删除机制后,改进的TLD算法针对多模板、长时间的跟踪情景实时性提高明显,对320x240的数据集实时性可提高20%以上。