论文部分内容阅读
行人检测一直是计算机视觉领域中热门问题之一,虽然经历了几十年的发展,但仍然有很多需要解决的问题。作为计算机视觉的基础问题之一,它的性能往往会制约更高层次的计算机视觉问题的解决,如姿势估计、行人目标跟踪等。因此,行人检测仍然是计算机视觉的热点问题。行人检测系统优劣往往以两个指标进行衡量,一个是检测的准确率,一个是检测的速度。目前学术界研究重点仍然偏向检测的准确率,但是工业界则更关心行人检测的速度。目前行人检测的准确率已经比较高然而检测速度却很没有达到期望的效果。文章的目标就是对行人检测系统在不降低检测准确率的前提下对行人检测速度的提升进行研究探索。文章的主要工作如下: 基于视频流的行人检测,利用高斯混合模型将视频序列信息与传统的基于图像的行人检测方法相结合。高斯混合模型用来提取前景,并把前景视为应用行人检测的感兴趣区域,这样就能够减少行人检测的区域,从而提升整个行人检测系统的检测速度和检测精度。 提出利用主成分分析(PCA)对梯度方向直方图(HOG)特征进行降维,这样能够提升分类速度,从而进一步提升行人检测速度。文章还重点讨论了降维后的维度选择,以及最优维度的评价规则。实验表明PCA-HOG比传统HOG特征在利用支持向量机分类阶段的分类速度提升了近百倍。 文章介绍了支持向量机的分类原理和算法实现,并利用支持向量机对行人特征进行分类从而实现行人检测。其中分别讨论了文章中模型在基于视频序列与基于图像的检测效果和检测速度。 最后详细描述了其它行人检测文章经常忽略的步骤:检测窗口的融合。文章把检测窗口融合问题转化为在数据中寻找聚类中心的问题,最后利用 Mean Shift算法解决该问题,大量实验同时论证了基于Mean Shift的窗口融合的有效性。 实验表明,文章提出的快速行人检测系统在基于视频与基于图像的行人检测中在不降低基于检测精度的同时,相较于传统的基于HOG的行人检测系统速度上均有一定程度的提高。此外,还详细描述了行人检测系统的各个步骤以及后期处理,对基于目标检测的工程项目具有一定的参考意义。