论文部分内容阅读
轨迹所包含的丰富语义信息,可以表达运动目标之间在时间和空间上的相互作用。在智能视频监控领域,如何有效地提议运动目标以及描述目标的活动模式一直以来都是研究的重点和难点,在对以往研究工作的深刻总结后,我们发现了两个主要的研究方向:一是提取目标随时间移动而形成的空间轨迹,从轨迹中建模以求发现场景结构中典型的运动模式;二是基于图像帧的网格划分,对网格提取包含丰富空间信息的外观和运动等局部时空特征,并聚类以发现视频场景中常见的活动模式。本文有效结合上述两种方法的优点,即轨迹特征所具有的强大跟踪能力和局部时空特征所具有的强大描述能力,分别在运动提议和异常检测两个子任务上进行了多项验证实验,并主要开展了以下工作:(1)针对现有运动提议算法普遍步骤繁复且效率低下的问题,我们建议直接跳过视频的分割步骤,并提出一种基于密集轨迹对准及其融合描述符的方法扑捉视频目标运动的关键信息。首先,提取目标的空间轨迹,并严格控制轨迹的长度以解决轨迹在拥挤场景下的空间漂移问题,保证轨迹的高密度以良好提议视频前景目标;然后,沿着轨迹的方向提取与密集轨迹对准的融合描述符,沿着轨迹的方向提取描述符可以更好地描述特定目标在一段时间内的活动模式;此外,级联HOG、HOF和MBH的融合描述符对目标的变化也更加鲁棒,并且在一定程度上可以消除由于相机抖动而造成的背景漂移问题。(2)针对现有异常检测算法对拥挤场景下的目标跟踪和描述能力普遍不足的问题,我们将所提出的运动提议框架应用于异常检测任务中,在检测异常之前预先提议运动目标,除了能够大幅度提升检测系统的时间性能之外,还进一步抑制了背景区域对检测系统的负面影响。此外,针对异常活动的典型特性,我们沿着轨迹的方向提取与密集轨迹对准的运动影响描述符,该描述符能够有效地反映目标的运动速度、方向、大小以及它们之间在时间和空间上的相互作用,充分表达目标在密集场景下的时空特性。最后,本文还提出了一个完整的检测框架,可以同时检测全局和局部的异常活动,并在多个公共数据集的实验中比较了所提出的方法和其他最新方法的性能,结果表明所提出的方法优于这些最新方法。