论文部分内容阅读
提出一种基于卷积神经网络改进的行人检测方法。改进主要涉及两个方面,包括如何决定CNN样本迭代学习次数和如何进行重合窗口的合并。第一,关于CNN样本迭代次序问题,在顺序迭代训练多个CNN分类模型的基础上,提出一种基于校验集正确率及其在迭代系列分类器中展现出的稳定性并进行更优模型选择的策略,以使最终选择的分类器推广能力更优。第二,提出了一种不同于非极大值抑制的多个精确定位回归框合并机制。精确定位回归框的获取以CNN检测过程输出的粗定位框作为输入,然后对每个粗定位框应用CNN精确定位过程并获得对应的精确定位回归框,最后对多个精确定位回归框进行合并,合并过程考虑了每个精确定位回归框的正确概率。更精确来说,最终的合并窗口基于多个相关的精确定位回归框的概率加权求和方式获得。针对提出的两个改进,在国际上广泛使用的行人检测公共测试数据集ETH上进行了一系列实验。实验结果表明,提出的两个改进方法均能有效地提高系统的检测性能,在相同的测试条件下,融合两个改进的方法相比Fast R-CNN算法检测性能提升了5.06%,达到了 40.01%的检测结果。提出一种基于卷积神经网络的车型分类方法,首先建立了十万数量级的不同车型不同场景的车型分类数据库,通过设计网络结构并训练卷积神经网络模型,在其自定义测试集上进行分类器性能验证。实验过程中对样本进行了对齐和扩边界操作,对比了不同训练迭代次数产生的CNN分类器,最终得到的CNN分类器在车型分类数据库测试集上的平均正确率达到了 95.49%。实验结果表明,本文提出的卷积神经网络模型在车型分类任务上取得了较好的分类精度。