论文部分内容阅读
目标检测是计算机视觉的重要组成部分,主要是定位一张图片或者视频中特定物体出现的区域并判断图像中出现的目标类型。随着深度学习的发展,基于深度学习的目标检测在众多领域中取得了令人瞩目的进步。然而这些基于深度学习的目标检测算法需要巨大的内存空间和高性能的计算设备,无法直接移植于资源受限的设备。因此,本文在总结现有研究方法的基础上,提出了一种改进的目标检测网络并将其移植到树莓派上进行目标检测,论文的主要研究内容如下:(1)目标检测过程分为目标的分类和定位,图像质量也决定了目标分类的精度,但现实应用过程中图像受到各种外界因素的影响,所以在对图像特征进行学习之前需要进行预处理。通过图像预处理可以消除图像中的无用信息,保留有用的真实信息,从而提高特征提取的可靠性和待检测目标的分类准确率。本文研究了图像灰度化,对比了不同阈值及阈值函数选择下的图像去噪效果,选取了最优的阈值及阈值函数进行小波去噪,得到更高质量的图像以提升模型的分类准确率。(2)提出一种联合扩张卷积和深度可分离卷积的轻量型神经网络。为了弥补当前深度网络参数量过大无法应用于资源受限设备和压缩网络导致准确率下降的问题,提出的一种基于扩张卷积和深度可分离卷积的轻量型神经网络,该网络不但极大的减少网络卷积运算中的参数和计算量,降低网络的大小,而且在保持每次卷积参数量不变的同时,增大卷积过程中的感受野,使得卷积过程中提取到更多全局且语义层次更高的特征,提高网络的分类准确率;此外,通过设置宽度因子,输入图片分辨率和扩张率三个超参数在保证较高准确率的前提下进一步降低模型的参数和计算量。实验结果表明,本文提出的方法能有效压缩网络大小,且得到较好的分类准确率。(3)针对目标检测算法SSD(Single Shot Multi Box Detector)利用低层特征图检测小目标容易导致特征提取不充分的问题,提出了基于空间金字塔的多尺度特征融合算法对传统SSD算法进行改进。首先,通过对低层特征进行多尺度卷积以增强深层特征提取;然后,融合得到的多尺度特征,使得得到的特征图能表征更多的信息。实验表明,该方法有效的提升了网络的检测精度。此外,将提出的联合扩张卷积和深度可分离卷积的轻量型网络作为改进后SSD的骨干网络,构造了一个基于改进SSD算法的轻量型目标检测网络,实验表明,在高性能计算机上,该网络能有效的权衡检测速度和检测精度之间的关系,在达到较快检测速度的同时拥有较高的检测精度。(4)为了将本文提出的目标检测网络应用于嵌入式等资源受限设备上,且能较好的实现目标检测任务。本文基于树莓派设备,采用Tensor Flow和Tensor Flow Lite两种方法对提出的模型进行移植,在树莓派上重建训练好的模型;然后通过设置树莓派摄像头模块实时采集图像并将每一帧图像输入到模型中进行目标检测。实验结果表明,该网络可以有效的在树莓派上进行目标检测,且Tensor Flow Lite框架能有效的提升模型的检测速度。