论文部分内容阅读
视频目标跟踪是机器视觉领域中的研究热点,已经被广泛地应用到各个领域。然而,由于跟踪场景复杂性和目标运动不确定性等因素,实现目标的持续性跟踪存在很多困难。为了解决这些问题,近年来,丰富的机器学习方法(如子空间学习、度量学习、流型学习和深度学习等)被引入到视频跟踪研究中,旨在使目标的外观模型具有学习能力,从而及时适应目标不同的外观表现形式(如部分遮挡、光线变化和运动模糊等),然后利用观测模型从目标候选集合匹配出最佳的跟踪状态。这类基于外观模型学习的视频跟踪方法,从目标表示模型设计、观测似然方式设计和基于运动估计的候选目标集合构造等方面进行深入研究,为视频目标持续性跟踪问题的有效解决带来了新的思路。本论文基于外观模型学习的基本框架,从如何设计外观模型增强目标表征能力和如何利用运动模型提高候选目标质量的角度展开研究,主要研究工作和创新点描述如下:1.提出一种基于稀疏约束增量非负矩阵分解(Incremental non-negative matrix factorization,INMF)的视频目标跟踪方法。该算法基于目标的NMF子空间表示和稀疏表示两方面理论,将非负约束引入到基于矩阵分解的稀疏外观模型构造中,采用NMF基向量代替传统稀疏表示中的像素级别的原子,通过迭代优化求解策略获得最优的外观模型。然后,利用INMF学习确定模型参数,完成字典更新,实现持续性目标跟踪。试验结果证明,提出的算法对光线变化、运动模糊和部分遮挡等问题具有更好的跟踪精度。2.提出一种多任务稀疏原型的视频目标跟踪算法。该方法通过挖掘稀疏表示模型中原子之间相关性的角度提高目标表示能力,将经典的单任务稀疏原型跟踪算法拓展到多任务学习框架下,并采用Dirty模型设计组群约束以共享基向量间的共同特征。同时,设计逐元素约束以体现基向量间的差异性特征,避免传统多任务学习中暴力强迫所有单任务分享相同结构特征而导致模型表达能力下降的问题。然后,利用加速逼近梯度下降(accelerated proximal gradient,APG)方法求解最优化问题,确定模型参数。最后,利用增量主成分分析(Incremental Principal Component Analysis,IPCA)学习模型参数,完成字典更新,实现目标持续性跟踪。试验结果证明,提出的算法对光线变化、运动模糊和部分遮挡等问题具有更好的跟踪精度。3.提出一种基于SIFT flow运动预测的稀疏跟踪算法。该方法在多跟踪器框架下对传统稀疏表示跟踪方法进行拓展,首次将SIFT flow方法引入跟踪问题,解决因目标在视频帧间出现大位移情况下引发的跟踪失败问题。同时,为了提高外观模型对部分遮挡和光线变化等现象的适应能力,将SIFT flow跟踪器融入到经典的稀疏跟踪框架下,通过多跟踪器混合采样机制,提高目标候选集合的有效性。然后,利用动态模板替代,完成字典更新,实现视频目标的持续性跟踪。试验结果证明,提出的算法对光线变化、运动模糊和运动突变等问题具有更好的跟踪精度。