论文部分内容阅读
自从深度学习诞生以来,目标检测技术在计算机视觉领域持续引发着广泛的关注与讨论,其应用场景也涉及到诸如交通、气象、军事、教育、农业等各种领域。其中,对于某些遥感图像领域的应用,除了保证必要的检测精度外,更加侧重于信息处理的实时性,例如交通状况分析、定位导航、异常行为预警等。该场景下,图像中目标信息的时效性很短,单位时间内获取的数据量较大,所以研究快速、有效的视觉目标检测模型有着重要的意义。针对上述背景,本文研究并设计了一个轻量级的卷积神经网络,并在此基础上进一步压缩模型以适应高通量的遥感图像输入。主要工作包括:1.提出并设计一个轻量级的目标检测网络micro-YOLO,用以替代传统YOLO算法中较为庞大的Darknet网络。该网络模型沿用了YOLO算法的主要思想,即一次预测出所有类别的目标框,而在网络架构上通过减少卷积层数来压缩模型,同时减少大量浮点运算。另外,micro-YOLO融合了MobileNet的核心思想,使用深度可分离卷积和多层特征图融合算法,来维持检测精度和速度的良好平衡。2.进一步实现高通量的目标检测模型,使用多种方式进行模型压缩。首先分析网络结构,将贡献较小的连接层进行裁剪,缩小网络规模;然后将稀疏化的权值矩阵以压缩方式存储,减少内存占用;最后进行权值量化,改变浮点数运算的位数,减少位宽消耗,进一步降低前向传播计算复杂度。最终通过实验验证,所提micro-YOLO网络模型大小为4.6MB,与YOLO-v2相比,micro-YOLO网络模型以1.64个百分点的精度换取了7倍左右的速度提升,模型大小约是YOLO-v2模型的十三分之一。