论文部分内容阅读
将最新的深度学习技术应用于大尺度遥感图像处理中,可以有效利用遥感图像中丰富的细节信息进行图像分类、目标定位和识别。本文主要研究大尺度遥感图像像素级分类问题。在分析现阶段国内外研究状况和介绍深度学习相关理论的基础上,针对现有模型的不足,本文提出一种改进的具有深层网络结构的多尺度融合全卷积网络,并命名为DFCI-FCN。具体内容如下:
首先,介绍了一种用于大尺度遥感图像像素级分类的多尺度全卷积神经网络MS-FCN,但是该模型受限于网络深度,提取的层次特征不能够充分发挥全卷积网络的优势。针对这个问题,本文提出使用更深网络结构来进行遥感图像中高维非线性特征的提取。此外,特征提取时必要的池化操作造成了图像细节信息丢失,使得网络模型最终的预测结果在目标边缘和转角处变得模糊。针对图像细节丢失问题,本文修改传统全卷积神经网络中的解卷积策略,提出了一种改进的逐层融合策略,通过将深层抽象特征与浅层低级细节特征融合来缓解识别和精确定位的矛盾。然后,在预测阶段,本文提出一种简单有效的中心域提取方法,通过丢弃包含噪声的外围网络输出来提高最终的预测精度。最后,针对大部分大尺度遥感图像中目标像素占比低的现象,本文提出使用基于FocalLoss的损失函数改进传统的交叉熵损失函数来缓解在训练阶段可能出现的类不平衡问题。
实验结果表明,通过适当的增加网络深度,结合改进的逐层融合策略,可以有效利用空间上下文信息,提高了网络模型的表达能力。在预测阶段使用合适尺寸的中心域提取网络模型输出,可以明显降低卷积运算引入的噪声影响。而本文提出使用的基于FocalLoss的损失函数不仅加快了网络模型训练的收敛速度,而且网络最终可以收敛在更好的局部最优点。最终,本文提出的一种改进的具有深层网络结构的多尺度融合全卷积神经网络DFCI-FCN相比较MS-FCN在IOU指标上获得了10.16%的性能提高。
首先,介绍了一种用于大尺度遥感图像像素级分类的多尺度全卷积神经网络MS-FCN,但是该模型受限于网络深度,提取的层次特征不能够充分发挥全卷积网络的优势。针对这个问题,本文提出使用更深网络结构来进行遥感图像中高维非线性特征的提取。此外,特征提取时必要的池化操作造成了图像细节信息丢失,使得网络模型最终的预测结果在目标边缘和转角处变得模糊。针对图像细节丢失问题,本文修改传统全卷积神经网络中的解卷积策略,提出了一种改进的逐层融合策略,通过将深层抽象特征与浅层低级细节特征融合来缓解识别和精确定位的矛盾。然后,在预测阶段,本文提出一种简单有效的中心域提取方法,通过丢弃包含噪声的外围网络输出来提高最终的预测精度。最后,针对大部分大尺度遥感图像中目标像素占比低的现象,本文提出使用基于FocalLoss的损失函数改进传统的交叉熵损失函数来缓解在训练阶段可能出现的类不平衡问题。
实验结果表明,通过适当的增加网络深度,结合改进的逐层融合策略,可以有效利用空间上下文信息,提高了网络模型的表达能力。在预测阶段使用合适尺寸的中心域提取网络模型输出,可以明显降低卷积运算引入的噪声影响。而本文提出使用的基于FocalLoss的损失函数不仅加快了网络模型训练的收敛速度,而且网络最终可以收敛在更好的局部最优点。最终,本文提出的一种改进的具有深层网络结构的多尺度融合全卷积神经网络DFCI-FCN相比较MS-FCN在IOU指标上获得了10.16%的性能提高。