论文部分内容阅读
视频图像序列中的运动物体的检测和追踪是计算机视觉领域的重要研究课题之一。在譬如安全监控、交通监控、增强现实等越来越多的应用中,视频图像中的运动物体检测和追踪都起着举足轻重的作用。在诸如车辆导航、机器人视觉系统等科研项目中,视频图像中的运动物体检测和追踪则是重要的研究课题之一。在本文中,我们提出了一种新的运动物体检测算法。在算法中,我们首先将视频按照时间窗口划分为许多小的视频片段,从而长时间复杂的相机运动过程被这些小的时间窗口划分为许多短暂而简单的运动。时间窗内相机的运动可以被近似看作相机自旋转,小尺度平移和放缩的复合运动。而根据单应性原理,在这种情况下相机拍摄到的图像可以映射到同一个坐标空间中。在这个坐标空间中,背景与相机之间的相对运动被消除,不同帧的相同背景点被映射到坐标空间中的相同坐标处。然后,我们在这个坐标空间中建立无监督的码本模型来对场景背景进行建模,并在码本模型的基础上分类出每一帧中运动物体的像素点。无监督的码本模型是经典码本模型的改进版本,它通过每一个坐标点处像素值序列的统计特征来决定哪些像素值是属于背景哪些像素值属于前景。本文的主要贡献可总结如下:(1).对于持续时间长的视频,本文使用了基于滑动时间窗处理的思路和方法。这种方法可以明显降低长时间视频的内存和cpu资源的消耗,为其他视频处理算法的改进提供了参考。(2).本文提出了动态场景的背景建模方法。图像配准步骤消除相机与场景背景之间的相对运动,使得动态场景可以像静态场景一样进行背景建模。在为动态场景进行背景建模的基础上,一些的鲁棒性和准确率良好的静态场景运动物体检测方法就可以尝试移植到动态场景的运动目标检测应用上来。有望为动态场景中的运动物体检测问题开拓新道路。(3).本文提出了一种无监督的码本模型。无监督码本模型算法是经典码本模型算法的改进,它避免了训练过程,通过背景和前景在观察值序列上所特有的统计规律来分辨判别前景和背景。