论文部分内容阅读
在卫星遥感和软硬件技术的不断发展中,遥感影像检测中有越来越多的计算机视觉方法和深度学习方法被应用。遥感影像与自然影像相比发展要缓慢得多,因为遥感影像的尺寸较大、包含的信息复杂繁多、对比度不高、前景和背景易混淆。近年来,人工智能技术开始井喷式发展,这就给遥感影像的发展带来了希望。Hinton课题组在2012年首次参加了Image Net图像识别比赛,他们创造的名为Alex Net[1]的卷积神经网络在这次比赛中成功取得第一,而且分类精度远远优于这次比赛的第二名(SVM[2]方法),他们成功地证明了深度学习在图像识别中的潜力。因为这次图像识别的大赛,卷积神经网络正式进入到了许多研究人员的视线里,从而开始了卷积神经网络的研究潮流。后来,Girshick等人又在2014年提出了一种图像检测的模型——R CNN[3](Regions with Convolutional Neural Network Features),这个模型成为了深度学习在图像检测领域的基础。在随后的一年多里,这个团队又相机提出了Fast RCNN[4]和Faster RCNN[5]这两个模型,打下了双阶段图像检测的基础,尤其是Faster RCNN,已经成为了图像检测领域的一个基准。遥感影像技术以及卷积神经网络的提高,特别是Faster R CNN目标检测领域取得的成功,极大地促进了Faster RCNN在遥感影像检测领域的应用研究。本文主要研究Faster RCNN在遥感影像物体检测的应用,完成了以下的研究工作:1.提出了新型的卷积神经网络层Echo Layer(回响层)。近年来,深度学习中的特征提取一般通过卷积层之间的顺序串联,但后续的特征信息不能和前期提取到的特征信息进行信息的交互和共享。该方法通过卷积层的复用,把前面通道提取的特征信息给后续通道进行参考,能让特征联系更加紧密。实验结果表明,该方法能提升模型的效果,并且能在不同的模型中进行使用;2.改进了Faster R CNN的模型结构。在Fast RCNN中,网络共享层较少,(与Faster R CNN相比)训练速率较慢,模型占用内存较多。故Faster RCNN在Fast RCNN的基础上把原有的起始卷积层和最后的全连接层进行融合,以达到双阶段训练共享层结构。本文通过实验表明,回归和分类两种不同的任务,采用同样的共享层结构,会导致模型信能减弱。本文提出把部分共享层拆分,能把模型性能得到进一步提升;3.研究了多种基于Faster RCNN的模型对遥感影像进行多类目标检测。尝试了把Mobile Net、Res Net、Dense Net等模型和他们的思路结合Faster RCNN模型,通过迁移学习,在Image Net的预训练模型进行微调,然后迁移进Faster R CNN的各种改进模型中,并通过实验证明了自然数据集中的模型也能平滑迁移到遥感影像识别中。