论文部分内容阅读
背景建模作为计算机视觉的一个重要内容,它在智能交通、人机交互、智能视频监控等系统中被广泛应用。具体的说,这些系统的底层通常使用背景建模方法来获取运动目标,因此,背景建模方法在这些系统中至关重要。现有背景模型主要分为基于时域信息的模型和基于时空域信息融合的模型。基于时域信息的模型是指利用过去一小段时间内像素的统计特性来预测该像素短期未来的状态,而基于时空域信息融合的模型在利用时域信息的同时也关注像素在空间域上的分布特性。本文通过对现有典型算法分析,发现无论是只使用时间域信息的模型还是使用时空域信息融合的模型都只考量狭小时间段内的统计特性。然而,在整个背景建模的过程中,场景背景的变化有周期性重现的特点(如光线的变化情况等),如果仅在小时段时空域上研究,必定会丢失周期性信息,使更新受限。针对该问题,本文将周期性信息合理记录,构成带记忆的模型,在发生非平稳变化时,直接在记忆字典中找到对应变化特点的背景作为此时背景,并使用它更新模型,实验验证可以大幅度降低虚警数。为了充分利用背景长时间周期性重现特点,本文搭建一个合理融合大时空域信息的基于长时间视频序列的背景建模框架,并在该框架上研究背景建模方法。整个过程主要包括以下几个内容:1)生成有效的背景描述子用以合理描述长时间背景信息,本文通过对长时间视频剪辑、求平均背景两步生成背景图片,之后对背景图片降采样、降维,产生有意义的背景描述子;2)生成简单并兼顾实时性的背景字典,本文采用谱聚类对背景描述子粗分类,并使用K-means++对背景描述子进一步细分类,利用类别中典型描述子建立树形字典;3)在背景词典中检索所需背景,计算原图描述子与背景词典描述子之间的欧式距离,距离小的即为所需背景描述子,其对应的背景即为此时背景;4)通过背景字典更新模块使背景字典长久的适用于场景,增加适应场景变化的能力;5)通过设计突发变化判断机制来将长时间的时空域信息与短时间的时空域信息结合,也就是将长时间记忆模型与短时间记忆模型融合。如果是平稳变化则使用现有短时空域信息模型,如果是突发变化则利用带记忆的长时空域信息模型。通过搭建这样一个可以嵌入现有背景建模算法中的框架,可以解决室内场景背景建模难题,有效实现运动目标检测。最后,本文从检测效果、性能、实时性三个方面在多个数据集上对本文方法进行实验验证,实验结果表明该方法在保证实时性的同时可以明显改善运动目标检测效果,并显著降低误检率。