论文部分内容阅读
行人检测是利用计算机视觉处理技术在视频序列中发现是否存在行人并进行精确定位。随着自动驾驶、智能监控等需求的不断增长,行人检测技术在检测速度及复杂背景适应上的要求越来越高,成为当前理论研究热点。本文在分析国内外相关工作成果的基础上,分别研究了基于支持向量机(Support Vector Machine,SVM)和深度卷积神经网络(CNN)的行人检测方法,实现了基于组合支持向量机行人检测方法、SVM-LeNet行人检测方法和Deblur-DPDCNN行人检测方法,在一定程度上降低复杂场景下行人检测的漏检率和误检率,提高了检测速度。本文的主要贡献如下:(1)实现了基于组合支持向量机行人检测方法(Combination Support Vector Machine,CSVM)。在复杂背景行人检测问题上,针对单个SVM表现出的性能不稳定问题,实现了面向HOG特征的、组合多个SVM分类器的行人检测方法:HOG-CSVM。实验表明,相比HOG-SVM行人检测算法,HOG-CSVM具有更低的误检率和漏检率;(2)实现了SVM-LeNet行人检测方法。本方法的关键技术包含:a)为了提高对行人特征的高区分能力,构建了融合LUV颜色特征和HOG特征的组合特征。b)为了增加分类器对行人目标特征微小差异的敏感性,提出使用SVM进行第一阶段分类,然后使用三层卷积神经网络进行第二阶段分类的方法。该方法有效避免单一分类模型的偏差无法得到及时纠正的缺点。c)针对采用传统的贪心非极大值抑制算法(Non-maximal Suppression,NMS)存在目标区域定位不准的问题,在该基础上,实现了微调非极大值抑制算法(Fine-Tuning Non-Maximum Suppression,FTNMS),实验表明,相比NMS,经过FTNMS融合后的矩形能更准确框定真实目标;(3)实现了Deblur-DPDCNN行人检测方法。首先对目标图像进行去运动模糊处理,得到画质较清晰的图像。然后采用选择搜索法(Selective Search)提取候选区域,以避免传统多尺度滑动窗口方法难以处理行人姿态多变的不足,最后采用5层卷积神经网络(Convolution Neural Network,CNN)对候选区域进行目标分类。实验表明,Deblur-DPDCNN行人检测算法已经达到了与Faster-RCNN相当的水平。