论文部分内容阅读
随着大数据技术的快速发展和国家对人工智能领域的大力支持,基于深度学习的目标检测技术广泛应用于行人检测、人脸检测、汽车无人驾驶、智慧城市以及快递物流等多个领域。而深度卷积神经网络在目标检测技术中能够自动提取图像中更加丰富的特征信息,很好地解决了传统目标检测算法中网络泛化能力差,手动设计特征难以解决目标多样性等难题,并且在检测速度和准确度上都有了很大的提升。但基于深度卷积神经网络的目标检测技术并不能够同时兼顾检测模型的准确度和检测速度,而基于Darknet网络的YOLOv3算法作为极具代表性的单阶段目标检测模型,很好的平衡了检测准确度和检测速度之间的关系,在实际工程应用中有着很高的参考价值。本文在基于深度卷积神经网络的单阶段目标检测算法的研究方向上,结合现有的单阶段检测算法YOLOv3,通过对具有自注意力机制的轻量级主干网络的设计,边界框的度量标准的设计,收敛更加迅速准确的损失函数的设计,以及在预测阶段对非极大值抑制算法的改进等措施提出了一种新的单阶段的目标检测算法,具体措施如下:(1)为进一步提高YOLOv3的检测速度,在网络模型设计的过程中,我们使用深度可分离卷积代替传统的卷积操作,使得网络在有效提取图像特征的同时,大大的减少了网络参数。同时算法在网络的每个卷积模块中,分别在空间和通道两方面引入了自注意力机制,使得网络在执行卷积操作时能够更加关注图像中目标信息,更加有效地提取复杂的图像特征信息。(2)在模型训练过程中,我们重新设计了预测边界框之间的度量标准,使用GIo U算法更精确的表示两个边界框的重叠程度,并结合GIo U对原有的损失函数进行了重新设计。具体的,为加快损失函数的收敛,本文使用边界框之间的重叠程度以及两个边界框之间的中心点距离作为损失函数替代原有计算中心点的损失函数和边界框宽度和高度的损失函数,并使用YOLOv3原有的物体类别和置信度的损失函数,使得边界框在训练过程中有着更快更准确的回归,也使得检测算法对于图像中的小目标检测更加友好。(3)在模型预测的过程中,结合GIo U算法对原来的非极大值抑制算法进行改进,在筛选候选框时使用高斯模型对周围的边界框进行抑制,而不是删除它们,并计算有关GIo U和边界框中心点距离的值作为筛选候选框的阈值。这使得模型在进行预测时,能够在一定程度上避免删除密集图像中的遮挡目标,筛选出更加准确的候选框。最后在Pytorch框架下,分别使用Pascal VOC和MSCOCO 2017数据集对本文设计的目标检测模型进行训练、验证和测试。实验结果表明,相比原来的YOLOv3检测模型,本文所设计的单阶段目标检测模型在总体检测精度以及对图像中较大物体或者单一物体的检测精度上表现相近,m AP值达到了0.5左右。但是在小目标检测和目标遮挡问题上有着更好的表现,小目标检测的检测准确度m AP达到了18.2%,增加了一个百分点。同时与其它主流的目标检测算法相比,本文所设计的单阶段检测模型在检测速度上有着明显的提升。除此之外,为进一步提高本文设计的单阶段检测算法的泛用性,本文使用KAIST多光谱行人数据集对所设计的模型进行训练和测试,并对红外图像中的行人进行检测。测试结果表明,本文所设计的目标检测算法有着更高的检测准确度,最终的m AP值达到了0.8以上。