论文部分内容阅读
本文着力解决对智能车驾驶环境理解时,目标检测任务的两个经典难题:准确性和快速性。在智能车的驾驶过程中,需要时刻获取周围的环境信息以判断行驶方向与速度,因此作为判断基础的目标检测,其准确性决定了智能车对周围环境感知的能力。同时,对于在智能车行驶过程中使用的目标检测网络需要实时反馈给控制中心检测结果,因此对网络的快速性也提出较高要求。本文通过在基础检测框架上做出针对性改进,建立针对智能车驾驶环境理解的目标检测框架,并提出知识强制蒸馏算法,用于模型压缩与加速,实现对交通数据集又快又好的目标检测,满足智能车对驾驶环境理解的需求。本文的主要研究工作如下:首先,本文选择公开交通数据集KITTI作为研究数据集、Faster RCNN作为基础目标检测框架,对其从数据处理、框架结构、训练方式等方面做出改进,建立针对智能车驾驶环境理解的目标检测框架。在数据处理方面,做数据增强处理;框架方面,针对数据集调整锚点框比例、调整骨架网络、调整分类损失函数;在模型训练方面增加Hard Negative Mining的方式处理样本不均衡问题;还使用Soft-NMS算法,增加模型召回率。本文对以上所有改进均在KITTI数据集上做充分实验验证,逐步优化针对性的目标检测模型。实验结果表明本文针对智能车驾驶环境理解的目标检测框架有强大的检测能力,比通用框架效果提升22.6%。其次,本文提出知识强制蒸馏框架。知识蒸馏的思想在分类任务上取得较大成功,本文创新性地将思想应用在更复杂的目标检测任务中,提出了端到端可训练的知识强制蒸馏框架。同时,对比多种知识蒸馏方式和损失函数,分别做实验判断哪种组合更适用于目标检测任务。通过实验验证,用于知识蒸馏的Attention转移算法与归一化后的损失函数能得到最好的效果,也验证了知识强制蒸馏框架能在不大幅降低准确率的情况下,较大提升网络运行速度,可以有效应用在智能车驾驶环境的理解中。最后,考虑到智能车驾驶对环境理解需要又快又好的目标检测,本文进一步将前两部分的内容做了合并,建立针对性的知识强制蒸馏框架,继续在数据集上做多组实验并对比分析。实验结果表明,本文训练的模型有能力在大幅加速的情况下较少降低准确性,甚至在部分情况下有微幅提升准确性,满足智能车驾驶时对目标检测性能的高需求,使本文研究更接近实际应用。