复杂场景下的目标跟踪算法研究

来源 :东南大学 | 被引量 : 17次 | 上传用户:zzfivy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉目标跟踪技术是计算机视觉的重要研究课题之一,它是进行更高层次行为识别和图像语义理解的必要前提,有着广泛的应用背景(比如视频监控、智能交通、机器人导航等)。在跟踪过程中,如何有效地表示目标的表观,同时排除外界环境中的干扰因素(比如姿态变化、形状变化、光照变化、相机运动、目标遮挡等),是视觉跟踪中需要解决的问题。虽然在过去几十年目标跟踪的研究有了很大的发展,但实践表明复杂场景中的运动目标跟踪算法还远未成熟,仍然是一个富有挑战性的课题。针对跟踪过程中存在的困难,本论文在研究了传统目标跟踪算法的基础上,重点对目标表观的建模、模板更新方式、跟踪优化框架等方面进行了深入地研究。论文的主要工作和贡献包括:1)提出了一种基于粒子群优化框架下的目标跟踪算法。该算法考虑了目标的局部信息和不同帧之间SIFT特征点匹配,目标的局部信息能够处理部分遮挡,丢失的目标通过不同帧之间SIFT特征点匹配重新找到。首先将一个目标状态划分为多个不重叠的片段(Patch),每一个片段表示目标不同的部分,同时定义了片段的显著性函数。在跟踪过程中,利用显著值高的片段来对目标跟踪;当目标发生漂移时,通过当前帧图像的SIFT特征与目标模板相匹配来重新找到目标。另外,为了获得更加精确的目标状态,将匹配得到的SIFT特征点的位置信息融入到粒子群算法迭代的结果中。最后对目标模板更新时,只更新片段显著值高的目标模板,而显著值低的片段模板不更新,因此,该算法的更新方式避免了噪声混入到目标模板中造成跟踪质量下降。该算法在一些挑战性的视频数据集上进行了验证,通过对实验结果定性和定量分析说明了该算法的优越性。2)提出了一种等级关联的粒子群迭代多目标检测跟踪算法。针对目标在跟踪过程中受环境变化影响使其跟踪发生偏移的问题,本文提出了一种从目标粗匹配到粒子群算法精确定位的等级关联的多目标跟踪算法。粗匹配阶段,在粒子随机产生过程中融入了上下文信息,通过粒子的标号信息找到当前帧目标与前一帧中的哪个目标相匹配;目标精确定位阶段,通过粒子群迭代优化,找到目标最终的位置。对于有显著偏差的目标位置,采用Metropolis-Hastings采样算法进行纠正,同时完成模板更新。当目标之间发生遮挡时,通过自适应调整不同线索(颜色线索和运动线索)的权重来适应环境的变化,从而继续跟踪目标。实验证明,该方法融入了目标的上下文信息,使得目标匹配的准确度得到了提高,降低了跟踪的目标发生错误跟踪的可能。3)提出了一种基于超像素的在线跟踪算法。本文将超像素作为视觉线索,在此基础上提出了两种跟踪算法:基于超像素的L1跟踪算法(Superpixel-L1 Tracker, SPL1)和加权多示例学习跟踪算法(Weighted Multiple-Instance Learning, WMIL)。对于SPL1算法,通过超像素来构造字典对目标表观建模,然后在粒子滤波的框架下求解每一个粒子(候选目标状态)的L1范数最小化问题。把重构误差最小的候选状态作为跟踪结果。在字典更新过程中,为了减轻目标发生漂移的影响,而保留初始几帧的信息。对于WMIL算法,利用超像素特征建模目标的表观。跟踪过程中,每一个采样粒子依据对跟踪的贡献被赋予一个权重值,然后在多示例学习框架下训练分类器,并把分类值最高的候选目标状态作为目标跟踪的位置。最后,利用加权后得到的正负示例包来更新分类器。仿真结果验证了两种算法在目标发生长时间遮挡、尺度和光照变化时依然能够稳定地跟踪目标。4)提出了一种生成式模型和判别式模型协同的多任务学习跟踪算法。生成式模型忽视了一些对目标判别有用的背景信息,因此,他们在干扰的环境下跟踪目标的效率不高。而判别式方法能够充分利用目标信息和背景信息来分离出目标和背景。本论文使用多任务学习方法来解决目标状态的稀疏问题。首先,每一个候选状态作为一个单独的任务,并在每个状态内依次分割为m个子块。挖掘不同任务之间相应子块的关联信息来获得联合稀疏表示,从而降低了计算代价。其次,针对生成式模型和判别式模型,我们分别定义了两种似然度量准则。生成式模型的似然准则考虑了目标的局部信息;而判别式模型的似然准则考虑了目标的整体信息。在跟踪过程中,两个跟踪模型分别预测目标位置,并且使用一个跟踪器的结果来更新另一个跟踪器的表观模板,这种更新机制避免了单个跟踪模型的自学习问题。另外,采用Metropolis-Hastings采样方法对字典进行更新。最后,在挑战性的视频序列上分析了我们提出的跟踪算法性能,该算法优于其他主流的跟踪算法。5)提出了一种基于显著性检测的多目标跟踪算法。稀疏表示技术由于能够很好地处理噪声的干扰而被用于目标跟踪。同时,稀疏表示方法对多个类别的分类也取得了好的效果。本文将这一技术扩展到跟踪多个目标。首先离线学习显著性检测器,再用该检测器检测每一帧图像中的目标。最大的稀疏系数所对应的字典原子与目标最相似。因此,利用最大稀疏系数的子字典索引找到目标的匹配。其次,我们提出用随机梯度下降方法在线更新字典,并考虑把显著性检测器的字典作为初始字典。将每段视频的前10帧用于训练表观模型,找到字典中的每个原子表示场景中的哪一个目标。字典中不仅包括有目标模板,还有背景信息。另外,目标的局部信息和目标与目标之间的相对位置,以及匹配的特征点与目标之间的相对位置也被用来处理目标的遮挡和跟踪难以分辨的目标。实验结果表明,基于稀疏表示的方法能够降低目标错误匹配的数目,跟踪的性能在一定程度上得到了提高。
其他文献
随着社会经济的发展,车辆与日俱增,智能交通系统的应用受到人们的高度重视。作为智能交通系统的核心关键技术,交通标识自动检测和识别获得越来越多学者的关注和研究,并在驾驶
现阶段的物理实验大多是演示实验或在特定实验室进行。学生参与度较低,用于实验的时间十分有限。美国最新的实验教学仪器"口袋"实验室,具有适用面广、使用方便、探索自由、资
探讨自2007年下半年政府出台一系列生猪补贴政策以来,补贴政策实施的有效性以及如何合理制定补贴政策。
基于计算机视觉的人体动作识别在视频监控、视频检索、人机交互等领域有着广阔的应用前景,是近年来计算机视觉领域的研究热点。经过国内外学者几十年的不懈研究,该领域取得了
在有限元分析各个阶段都存在着大量数据共享,介绍了MFCODBC技术,并应用于有限元分析系统,实现数据输入输出、浏览及编辑等功能。
无论怎么营销,书的内容永远是第一位的。《西方经典通读》丛书到底想传达什么样的理念?希望提供人们什么样的思想营养?让丛书主编孙左满来说吧。
牛肉味美可口,深受消费者喜爱,市场需求量大,带动了养殖产业的发展。但在现实生活中,因养殖者对育肥牛养殖管理技术掌握不到位,以致于肉质不佳,缺少市场竞争力,本文就育肥牛
针对“一带一路”沿线国家多元文化背景展开跨文化教学是外语教学改革主动符合国家战略发展的需要,也是外语自身发展的需要。通过基于慕课的跨文化教学,借鉴“产出型语言内容
场景理解作为图像处理和计算机视觉研究领域中极其重要的基础性任务,其研究成果已广泛应用于军事无人机、航天器导航、网络多媒体信息搜索、智能监控、智能交通、医疗信息化
一些英国科学家近日表示,他们认为爱因斯坦和牛顿这两位著名的科学界泰斗可能患有一种名为阿斯佩吉综合征的孤独症.这种疾病最早是由维也纳内科医生汉斯·阿斯佩吉于1944