论文部分内容阅读
目标检测是视觉感知的一个重要任务,其目的是将视觉目标从背景中分离出来,或者分析不同目标之间的空间关系。在该问题中有四个关键因素影响着目标检测的性能:一是搜索方式;二是目标的表示;三是设计评分机制将可能包含目标的候选区域从背景中提取出来;四是采用可靠的非极大值抑制方法区分多目标和重叠检测,从而选取最置信的目标区域。区别于特殊目标的检测,本文重点研究一般目标类的检测方法。由于受视角变换、遮挡、光照变化等影响,同时,目标类内差异较大,都为目标检测带来了极大的挑战。本文对影响目标检测的前三个关键因素进行了深入的探讨,在词袋模型框架下表示图像,进一步研究图像中目标的快速搜寻机制,并探索利用不同分类器结合滑动窗口来协同检测目标。本文的主要研究工作及贡献如下:
1)提出了目标检测的两层搜索框架。考虑到滑动窗口搜索方式时间复杂性高的局限,和最优子窗口搜索机制(Efficient Subwindow Search)对目标定位较粗糙的局限,本文将两者结合起来,先利用最优子窗口搜索机制对目标进行粗定位,然后利用滑动窗口搜索机制对目标进行精细定位。实验验证了本文在检测精度和计算时间上的有效性。
2)提出一种基于视觉词判别性权重驱动的分支限界快速目标定位方法。针对最优子窗口搜索机制在训练样本不充足时,对目标定位不准确,本文研究视觉词的判别性,从而优化其在决策函数中对应的权重,较鲁棒地得到目标候选区域。实验验证了结合三种不同评价视觉词方法优化后的权重,获得的候选区域更加稳定。
3)提出一种结合两种不同特征滑动窗口分类器的协同目标检测方法。利用目标梯度直方图特征(HOG)和SIFT(尺度旋转不变算子)特征,分别形成分类器,局部范围内应用滑动窗口对目标进行协同定位,避免了利用一种分类器导致的标记漂移。实验表明该方法对定位精度有一定的提高。