论文部分内容阅读
人脸检测是计算机视觉中的一个基础而重要的研究方向,人脸检测技术被广泛应用于人脸识别、视频监控、基于图像内容的检索、人机交互等领域,具有重要的研究价值。人脸检测主要内容是对图片或视频中的人脸进行定位,返回人脸的位置,大小等信息。本文主要对人脸检测中的三个比较重要的问题进行了研究并最终实现了一个多姿态的人脸检测器,主要研究内容包括:人脸的特征编码。人脸的特征编码对人脸检测器性能至关重要,好的特征使得在特征空间中人脸与非人脸的差异比较大,区分这两种模式也会更容易。目前有很多的局部描述子被应用于人脸检测。本文对三种不同的特征:Haar-like特征,HOG特征,Integral Channel特征进行了对比实验,比较了它们在人脸检测中的性能表现。分类器训练算法。相较于传统的分类器级联方式,Soft Cascade分类器具有很多优点。Soft Cascade分类器的每一级的输出为前面所有弱分类器输出值之和,这样前面选出的特征会参与后面每一级的决策,得到分类性能更好的分类器。本文首先描述了Soft Cascade分类器训练算法,然后引入并行计算对Soft Cascade分类器训练算法进行了速度优化。针对Soft Cascade分类器训练过程中的特征冗余问题文中提出了一种新的回退策略,并对新引入的训练参数进行了实验,最终得到了性能更好的分类器训练算法。窗口合并。使用滑框检测会在目标周围产生很多重叠的检测框,最终定位目标需要将重叠的窗口合并。本文对四种窗口合并算法进行了比较实验并分析了它们对最终的检测结果的影响。最后使用文中描述的特征提取方法与分类器训练算法实现了一个多姿态人脸检测器,在AFW数据集上取得了较好的人脸检测结果。