论文部分内容阅读
目标跟踪是计算机视觉领域一个重要的研究课题,在现代生活众多的智能交互应用中扮演着重要角色,例如智能视频监控、无人汽车驾驶、无人机自动导航、家用机器人等。目标跟踪作为计算机视觉的关键问题之一,其理论算法上的突破和产业化应用对推动我国新一代人工智能产业发展具有重大意义。特征表示是跟踪算法的基石。基于产生式模型的跟踪方法使用目标的特征表示构建表观模型,基于判别式模型的跟踪方法使用目标和背景的特征表示构建分类器,而基于卷积神经网络的跟踪方法更是利用了深度学习的强判别力特征学习能力。因此,学习具有强判别能力的特征对于提高跟踪算法的性能十分关键。为了准确地区分目标和背景,本文从单特征学习和多特征融合两个方面展开了以下四个研究内容:1.提出了结构感知局部稀疏编码模型,用以解决传统局部稀疏编码模型在编码过程中空间结构信息丢失的问题,进而学习到更具有判别力的稀疏编码。本文提出的模型在保留局部相似性约束的同时,要求这些用来编码目标候选的模板小块应当尽可能地来自与候选整体上最相似的那个模板,从而保留模板小块之间的空间结构。为此,我们对每个候选的所有小块同时编码,并设计了一个重组函数将作用在同一个模板上的系数置于矩阵的同一行内,然后最小化重组后的系数矩阵的2,1范数。大量实验结果表明该模型取得了更好的跟踪结果。2.提出了基于属性的多分支卷积神经网络(Convolutional Neural Network,CNN),用来解决目标跟踪领域训练数据匮乏的情况下强判别特征的学习问题。本文提出的多属性分支CNN首先使用每个分支学习相应属性下的特征表示,然后使用融合层学习这些表示的自适应融合。这种设计比现有方法使用同一组参数学习所有属性下的特征表示更有利于特征学习。此外,通过对训练数据按挑战属性分类,降低了送入每个CNN分支的数据差异性,从数据层面也降低了学习难度。本文还提出了两阶段训练策略。首先,我们依次单独训练每个属性分支以保证每个分支学习到相应属性下的表示;然后,固定属性分支的参数,训练融合层参数将各分支的输出特征自适应组合起来得到可以应对复杂场景的强判别力表示。大量实验结果表明本文提出的模型取得了处于领域前沿的跟踪结果。3.提出了基于自适应累积Regret的特征融合算法,以充分利用不同CNN特征的组合优势。本文提出的基于自适应累积Regret的融合跟踪算法将每个专家的决策损失转换为一个称为Regret的量,通过最小化每个专家的累积Regret来更新专家的决策权重。我们对每个使用不同CNN特征的弱跟踪器维护一个不同的自适应累积Regret模型,该模型根据弱跟踪器在当前一段时间内的表现稳定性自适应地调整历史Regret和即时Regret之间的权重以使累积Regret准确地反应弱跟踪器跟踪性能,进而产生更准确的决策权重。大量实验结果表明本文提出的自适应融合算法可以取得更鲁棒的跟踪结果。4.提出了基于自适应即时Regret的特征融合方法,在融合多特征优势的同时使得融合算法的损失具有上界。本文从三个方面进行了改进了原始的Hedge融合算法。第一,本文提出了基于孪生网络表观相似度和欧式空间距离的弱跟踪器损失估计,为计算Regret提供更可靠的输入。第二,本文提出了基于一阶累积Regret的势函数,根据该势函数产生的决策权重在所有弱跟踪器上的分布更加平滑。第三,本文提出了自适应即时Regret模型,控制了累积Regret的取值范围,并且从理论上证明了融合算法的损失具有上界。在大型公开数据集上的测试结果表明该方法的跟踪性能处于领域前沿。