论文部分内容阅读
视频运动对象跟踪是计算机视觉的一个基本问题,具有广阔的应用前景,可以应用到视频监控、视频分析、机器人和智能人机交互等领域。运动对象跟踪的主要目的是获得运动对象在视频中的轨迹及运动参数,如,位置、尺度等。运动对象跟踪算法主要由表观建模和运动建模两个核心部分组成。本文分别针对这两个问题进行研究。在表观建模方面,本文采用的主要方法论是前景(即被跟踪对象)背景联合建模,分别提出一种基于在线特征选择的对象跟踪方法和一种基于增量二维线性判别分析的对象跟踪方法。在运动建模方面,本文以广播足球视频中的足球跟踪为背景,提出一种基于图模型的对象跟踪方法。最后,本文以提出的运动对象跟踪方法为基础,开发了一个从广播足球视频生成三维卡通动画的系统。具体地,本文的主要研究内容如下:第一,提出一种基于在线特征选择的对象跟踪方法。该方法将对象跟踪看成前景背景像素点分类问题,采用贝叶斯错误率评价每一个特征的分类能力,并选择具有最小错误率的若干个特征构建贝叶斯分类器组合。然后,贝叶斯分类器组合被用来赋予当前视频帧的像素点属于前景像素点的概率。最后,粒子滤波被用来在概率图上对运动对象进行跟踪。一种新的同时考虑了区域和边界信息的粒子滤波观察模型被提了出来。此外,借助一种叫做积分图像的数据结构,粒子滤波的观察模型可以被快速地计算出来。第二,提出一种基于增量二维线性判别分析的对象跟踪方法。该方法将对象跟踪看成前景背景区域分类问题,直接在二维图像矩阵上进行线性判别分析,提取具有前景背景区分性的子空间。由于直接在图像矩阵上进行操作,该方法具有很高的计算效率。而传统的线性判别分析方法需要将二维图像矩阵展开成一维向量,然后再进行线性判别分析,这样带来了代价较高的矩阵运算。此外,我们还开发了增量地更新子空间的方法,这进一步降低了所需的存储开销和计算代价。最后,粒子滤波被用来对对象的运动参数进行推断。第三,提出一种基于图模型的对象跟踪方法。对象跟踪方法一般采用对象检测算法进行初始化,其基本假设是对象的模式和周围背景相比具有足够的可分性。但是,对于一些对象,如,广播足球视频中的足球,很难提取有效的特征在单一的视频帧中对其进行检测。本文采用的策略是在连续的若干个视频帧中确定对象的候选区域,然后采用图模型建立候选区域之间的关系。具体地,每一个候选区域对应图的一个结点,相邻视频帧的两个候选区域之间用边连接。每个结点被赋予一个权值用来表示其是对象区域的可能性;同样地,每条边被赋予一个权值用来表示边上的两个结点对应同一个区域的可能性。最后,Viterbi算法被用来提取图的最优路径作为对象的运动轨迹。这个过程被称为短时跟踪。然后,用其初始化一个卡尔曼滤波器对对象进行长时跟踪。在跟踪过程中不断地对被跟踪区域进行校验,以确定跟踪是否失败,从而判断是否需要重新启动短时跟踪。第四,开发了一个从广播足球视频生成三维卡通动画的系统。在对体育赛事进行转播的过程中,通常有多部摄像机布置在场地的周围,但是,在同一时间观众只能看到一部摄像机转播的视频。用户希望从另外的视角观看比赛的进行。此外,每逢重大的体育比赛后,一些门户网站会提供进球片段的动画演示。但是,制作动画耗时耗力,而且只提供了单一的视点。鉴于此,基于前面开发的运动对象跟踪方法,本文综合利用计算机视觉和计算机图形学技术开发了一个可以生成足球比赛三维卡通动画的系统。它的特点是允许用户从不同的视角观看比赛的进行。