论文部分内容阅读
目标检测与识别是计算机视觉领域十分重要的技术手段,也是机器人实现交互式、自主化运行的关键环节。随着硬件计算资源的快速发展,深度学习方法通过大量数据来训练深度神经网络,以表达图像信息特征。与传统方法相比,该方法具有强大的泛化能力和性能优势,在大量计算资源的情况下能够取得超强的性能。虽然深度学习获得了一系列重要的成果,但是受限于中小型机器人嵌入式设备计算能力有限及复杂工作环境,基于深度学习的目标检测算法在嵌入式设备领域的应用研究还有待探索。本文主要研究基于深度学习的目标检测方法,以四旋翼无人机在自主化运动中的视觉需求为应用背景,针对无人机视角的特定数据特征,实现基于深度学习的无人机行人实时检测。首先通过无人机在不同环境下采集行人数据,根据PASCAL VOC公开数据集,利用图像标注工具手动制作无人机视角下的行人检测训练集及测试数据集,分别用来训练神经网络模型和对模型性能进行检测及评估。为了满足无人机实验中的目标检测实时性需求,从区域推荐法和归一法中选择速度较快的基于关键点检测的无锚框目标识别算法CenterNet框架。在此基础上构建并改进基于ResNet-18的漏斗形主网络架构的深度神经网络,用来进一步提升模型运行速度,减少模型参数数量,通过上采样回归得到待测目标的种类和目标框的坐标信息。同时引入深度可分离卷积块,对模型进行压缩,减少模型计算量。对所采集的行人数据训练集训练于神经网络,得到行人目标检测模型。最后对无人机机载模型进行实验测试,在不同场景和环境下检测模型的实际性能。实验结果表明本文所研究的轻量级目检测神经网络算法,能在机载计算资源有限的条件下满足准确性与实时性等方面的要求。