论文部分内容阅读
视频运动目标跟踪是人工智能技术的重要组成部分,是解决许多计算视觉问题的关键。关于视频运动目标方法的研究已经有了非常多的研究成果。然而当目标的外观由于光照变化、旋转、遮挡以及伸缩等因素发生变化,或是对目标跟踪受到所处同一环境、位置相邻且外观相似的目标干扰时(本文将发生这些情况的环境称作复杂背景),如何准确的跟踪运动目标,仍是一个没有解决的问题。本文从目标检测、目标模型方法以及目标跟踪方法等几个方面着手,针对这一问题提出一些解决方法。主要研究内容包括:(1)目标检测方法:针对空域图像,提出了一种基于稀疏表示理论的背景模型方法,这种方法利用了像素时空信息,不需要关于像素分布状况的假设,能够对环境噪声有较好的免疫能力。当利用背景减方法获得前景后,自适应融合颜色和纹理信息移除运动阴影,为后续的目标跟踪提供了好的基础。在H.264压缩域,由于运动矢量噪声的影响,仅利用运动矢量信息不能有效的分割运动目标。为了解决这个问题,本文提出了一种结合运动矢量、帧内预测信息以及数据分区信息的运动目标分割方法,为了减少运动矢量噪声的干扰,提出了一种时域结合空域的滤波方法。通过试验验证了算法的有效性。(2)目标模型方法:在复杂背景下,目标外观会由于光照、旋转和遮挡等发生变化,是现有目标跟踪方法失败的主要原因。本文中利用尺度不变特征对于光照变化、旋转等的不变特性构建目标模型,在粒子滤波的框架下,实现了对光照变化、旋转和遮挡情况下运动目标的跟踪。进一步,对于背景下,依靠任何一个特征描述目标,都可能会导致跟踪过程失败,采用多个特征进行目标跟踪会改善目标跟踪算法的性能。然而,同时采用过多特征却会导致计算复杂度急剧升高,甚至会导致“维数灾难”,造成跟踪性能下降。本文利用Fisher线性判别原理从多个特征中选择能够有效区分目标和背景的特征,并自适应的融合这些特征实现目标跟踪。(3)目标跟踪方法:粒子滤波由于其通用性和健壮性在视频跟踪领域得到了非常广泛的应用,然而粒子滤波算法伴随着较高的计算复杂度,并且可能会出现粒子贫瘠现象,导致跟踪失败。在本文中,针对这个问题提出了一种基于层次型粒子群优化的目标跟踪方法。这种方法仅需要使用少量粒子,并较好的解决多模式环境下的目标跟踪问题。