【摘 要】
:
目标检测是指首先预设一组与任务相关的类别,然后使用算法检测出图像中可能存在属于预设类别范围的目标。它是目前计算机视觉领域最为核心的任务之一,作为上游任务对其下游任务有着积极与深远的影响。虽然目标检测从传统方法阶段到深度学习阶段的发展历史久远而且非常成熟,但是目标检测应用于特殊领域,比如水下目标检测、无人机目标检测等还具有巨大挑战。由于数据采集困难,相比现有大规模公开数据集,这些领域的影像的规模和内
论文部分内容阅读
目标检测是指首先预设一组与任务相关的类别,然后使用算法检测出图像中可能存在属于预设类别范围的目标。它是目前计算机视觉领域最为核心的任务之一,作为上游任务对其下游任务有着积极与深远的影响。虽然目标检测从传统方法阶段到深度学习阶段的发展历史久远而且非常成熟,但是目标检测应用于特殊领域,比如水下目标检测、无人机目标检测等还具有巨大挑战。由于数据采集困难,相比现有大规模公开数据集,这些领域的影像的规模和内容要更少、更复杂。本论文所有实验都是基于通过无人机采集的VisDrone-DET2018数据集,该数据集存在影像尺度各异、成像条件差、遮挡、目标呈现多尺度、小目标居多等多方面的问题。这些问题都具有很大的研究价值与挑战性,它们推动着目标检测向前发展。本文选择基于 FPN(Feature Pyramid Network)的 Faster R-CNN 作为基线,并专注于通过数据处理、正负样本采样、损失函数和特征融合四项研究内容来改进算法,主要内容如下:1.设计有效的数据增强方法。有效的数据增强可以在数据量少的情况下,减轻网络的过拟合。本文在无损数据的前提下,设计了基于像素插值的数据增强方法,经过实验验证,该方法在本文数据集以及其他一些小规模数据集中都会有0.20%左右mAP(mean Average Precision)的提升。同时,新数据可以模拟拥挤、遮挡等样本形态。2.改进正负样本采样策略。本文在mAP特性分析的仿真实验中说明了难负样本对于网络训练的重要性。Faster R-CNN由于使用随机采样策略,导致采样后的样本关于交并比的分布与原始分布不一致。本文遵循“分而治之”的思想,将单个采样区间修改为多个小区间。该平衡策略可以有效提升数据集中单个类别的AP。3.改进损失函数。目标检测中有分类与回归两个子任务,其损失函数是二者相加之和。实验发现,在训练过程中分类损失和回归损失之间一直处于不平衡状态。本文通过增加简单样本的梯度改进了回归损失,有效地缩小了两种损失之间的差距,使得网络对于两种任务的优化更加平衡。4.改进FPN结构。FPN结构可以融合高低级特征,但是其融合方式并不是完美的。本文采用了三种特征融合方法进行了实验:(1)通过增加自下而上结构,让两种特征在各层级间分布更均衡。(2)首先将FPN中各层级特征缩放到统一尺度,然后逐元素相加,最后通过注意力模块优化混叠后的特征。(3)为了使得特征更具鲁棒性,本文通过引入反馈机制,让网络在特征学习部分更具灵活性。改进后的FPN对于多尺度问题或者小目标检测都有积极作用。此外,本文将ResNet50中的3×3卷积替换为具有动态感受野的卷积模块,有利于多尺度目标检测。同时,通过建模全局上下文信息,增加目标定位的精度。
其他文献
目标跟踪问题一直是军事、导航等领域的重要研究内容。随着无线传感器网络(Wireless Sensor Networks,WSNs)的快速发展,点目标的分布式跟踪技术得到了广泛关注。由于非线性系统比线性系统在实际工程中的应用更广泛,非线性系统中点目标的分布式跟踪方法逐渐成为研究焦点。随着传感器技术的发展,扩展目标的分布式跟踪技术也在海上监管、无人驾驶等新兴领域具有巨大的潜在价值。本文主要研究WSNs
无线传感器网络是一个低成本、灵活性强、易于部署的自组织网络,在目标探测、事件监测等军民领域具有广泛的应用前景。通常,无线传感器网络节点面临着计算能力、能量资源的限制。因此,如何减少传输数据冗余,降低节点能耗,保护数据安全成为无线传感器网络研究的热点问题。数据聚合是由网络中的传感器节点收集数据,通过上层聚合节点对收集的数据进行处理,是传感器网络数据处理的重要手段。目前,基于数据平均等简单的数据聚合算
随着信息技术及电子战的迅猛发展,雷达信号自动调制识别作为电子对抗侦察中重要一环,成为了目前信息化电子战的研究热点。传统的雷达信号自动调制识别方法主要采用脉冲描述字浅层特征和模板匹配过程。当面对日益复杂的战场电磁环境,传统方法往往计算量较大且依赖于专家知识,识别性能难以满足要求。近年来,伴随深度学习的兴起和广泛应用,深度学习神经网络被引入雷达信号识别方法中,尽管基于深度学习的识别方法取得了不错的识别
多输入多输出(Multiple input multiple output,MIMO)雷达是一种新型雷达,用来应对日益复杂的战场环境。MIMO雷达相较于传统的雷达具有更好的波形分集能力,并且可以改善目标识别和参数估计等各方面的性能表现。MIMO雷达根据天线阵列的放置情况来分为集中式和分布式。两者均可通过发射正交波形来提高性能,其中发射正交波形可以让集中式MIMO雷达在接收端形成虚拟孔径来提高参数估
环境声音识别(Environment sound recognition)是指让计算机设备以一定的算法方式对采集到的环境声音进行分类与处理的过程,其在智能机器人、移动设备监测、自动驾驶、环境安全监控、智能家居、智慧城市等领域都有广泛的应用前景,是计算机听觉(Computer Audition)领域重要的研究方向之一。环境声音分类和增强是声音识别领域重要的研究内容。随着人工智能技术的不断发展,神经网
随着社会经济的不断发展,人民群众对于生活品质和人居环境的要求不断提高,噪声污染问题也日益凸显。由于噪声的产生与人们的生活状态、主观意愿高度关联,先进的技术手段对于噪声监测和防治必不可少。定向声波发射技术可以用于具有高指向性的声源装置,由于避免了声波的扩散,从根本上减少了噪声的产生。参量阵是定向声波发射的代表性技术之一,可以在较小尺寸上实现定向声波发射。虽然许多的研究工作都致力于降低参量阵的失真水平
无线传感器网络具有无线感知以及无线通信的作用,是重要的三维网络研究技术之一。传感器网络由多个具有自组织能力的节点组成,是当前网络研究中的一个热门领域,应用于多个领域方面,例如军事预防,地震监测,环境监测以及海底勘探等。目标跟踪技术是研究三维空间发展的重要部分,利用多个传感器节点的数据信息估计出目标当前时刻的状态。在目标跟踪系统中,利用滤波技术估计目标运动状态,根据滤波算法来消除相关的不确定性,实现
切换系统是一类动态混杂系统,由若干个子系统和一个协调子系统运行的切换规则构成,其在理论研究和实际应用中有着重要作用。在现代科技社会中,切换系统有着广泛的应用,如机械自动化、电力电子、交通网络等,并且关于切换系统的研究也日益受到关注。为了减少切换系统稳定性条件的保守性,本文引入矩阵多项式用于构造李亚普诺夫函数。矩阵多项式可以引入更多自由变量,从而降低线性矩阵不等式条件的保守性。根据这一特性,本文将矩
随着智能交通的需求,车联网系统是改善城市交通压力的一个重要突破点。其中车辆计数已经成为一个重要的问题,它可以用来缓解交通拥堵,提高交通灯的通行效率。城市规模的多摄像机车辆跟踪也是智能城市和交通管理中的重要任务。道路交通异常检测是计算机视觉的基础工作,在视频结构分析和城市交通分析中起着至关重要的作用。本文针对车联网环境下基于深度学习的路网交通优化研究,将主要对车辆计数、车辆跟踪和交通异常检测方法进行
目标定位,特别是多目标定位问题,一直以来都是信号处理领域内的重点问题,目标定位在雷达、声呐以及导航系统中都起着至关重要的作用,在射电天文学,地震学等领域中也得到了广泛的应用。近年来,目标直接定位(direct position determination,DPD)算法因其在某些条件下更加出色的性能,逐渐成为了目标定位算法中的研究热点。随着分布式无线传感器网络相关研究的不断深入,分布式算法可拓展性和