论文部分内容阅读
近年来随着相关技术的发展,遥感图像的分辨率大大提高,图像中包含更多的细节信息,这对目标检测模型的检测能力提出要求。目标检测后的信息,可为如城市规划、环境保护、农作物监测、洪水和防火等任务提供帮助。由于高分辨率遥感图像中复杂的背景信息、噪声干扰、天气影响、照明强度等因素,使目标检测工作面临更多挑战。目标检测是图像解译中最基础的任务。近年来,卷积神经网络CNN(Convolutional Neural Network)在视觉领域表现优秀。卷积神经网络在设计之初,是受图像处理中的卷积操作启发,因此相比其他领域,CNN在处理图像问题时,表现更加优异。深度学习技术的一个特点是需要大量的训练数据,而遥感技术的进步使高分辨率遥感图像更易得,这为将CNN应用于遥感图像目标检测提供可能。与地面拍摄图像相比,高分辨率图像具有不同特征:(1)背景复杂,图像包含的地域广阔,会有各种各样的地物背景;(2)物体通常较小,对于一张几千乘几千的图像来说,目标可能就是十几乘十几像素,而背景占比大;(3)由于拍摄角度单一导致目标外观变化小、旋转多;(4)地面采样距离(ground sample distance,GSD)不同导致物体具有不同尺度。当前许多遥感图像的检测工作开始使用深度特征,但将CNN用于遥感图像检测时没有全面考虑上文提到的图像特有特征,以及CNN在处理遥感图像时的缺陷:(1)CNN不具有旋转不变性,其池化层可使目标的轻微旋转对检测结果无影响,对于大角度的旋转不能保持结果不变,而遥感图像中目标旋转性强;(2)从低层到高层,特征图将会逐渐减小,并丢失精确的位置信息,而遥感图像中都是小目标,定位时更依赖于低层特征图中位置信息;(3)CNN参数量大,并具有计算密集的特点,虽然高分辨率图像数量随着相关技术的发展有所增加,但遥感图像训练集相对于地面拍摄图像训练集仍然较小,因此需要考虑如何匹配网络与训练集大小以及计算量的问题。此外,当前遥感领域许多工作在提取候选区域阶段,仍在使用Edge Boxes、选择搜索等方式,其缺点是:(1)使用手工特征,表达能力较弱;(2)模型要提取大量的候选区域,耗费的时间是惊人的。针对以上问题,我们提出基于修剪策略的遥感图像目标检测PSTD(Pruning Strategy based Target Detection for Remote Sensing Image)方法。为提高计算效率,本文提出采用自主学习的方式构建网络架构,具体采用修剪策略对网络进行修剪,然后将这种稀疏网络的方法用于目标检测网络,从而构建稀疏的网络架构,加速网络的运算速度。同时我们对原训练集进行处理,让网络能平衡学习目标与背景信息。本文主要由以下几部分工作构成:(1)遥感图像和目标检测的背景综述。首先对目标检测模型近年的发展状况进行阐述,介绍了从两阶段到端到端的典型目标检测模型及每种模型的优缺点。然后对遥感图像的成像及处理技术进行简介。(2)提出Sparse CNN算法。我们首先阐述卷积神经网络具有的冗余性缺点,冗余是由于网络参数量和数据集中图片数量不匹配造成的,针对此缺点我们提出稀疏卷积神经网络(Sparse CNN)算法。(3)提出PSTD方法。针对遥感图像训练集相对较小的特征,利用稀疏卷积神经网络算法,设计训练目标检测网络的算法,从而使网络与遥感数据更匹配,运算速度更快。然后使用多层特征图的方式解决遥感图像的目标小、尺度不同的问题。对于遥感图像背景占图像比例大的特征,使用平衡采样,难分负样本挖掘(hard negative mining),来增加网络的表达力。最后,对于遥感图像的旋转特性,使用数据增强的方式解决。(4)为验证提出的遥感图像目标检测方法的性能,设计实验从精确度-召回率曲线、平均运行时间、平均精确度和m AP,来定量评估模型,并设计实验评估Sparse CNN算法的修剪能力。实验结果表明Sparse CNN算法可较大程度修剪网络,PSTD在遥感数据上具有较强的检测能力。