面向高分辨率遥感影像场景分类的深度卷积神经网络方法

来源 :武汉大学 | 被引量 : 2次 | 上传用户:liqixuexue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大量高分辨率遥感影像的获取以及高分辨率遥感影像信息提取技术的发展,高分辨率遥感影像地物分类基本完成了从面向像素分类到面向对象分类的过渡,利用高分辨率遥感影像的空间细节信息丰富的特性,从对象层次对遥感影像进行分析,极大地改善了地物分类效果。然而,当前基于对象的遥感影像地物目标提取方法只能获得如建筑,道路等目标层解译结果,在获取如工业区、居民区等深层场景语义方面仍无能为力。为获取高层场景语义信息,如何跨越底层特征与高层语义信息之间的存在的“语义鸿沟”,实现高分影像到高层场景语义之间的映射,是当前高分辨率遥感影像理解的一个热点问题。为克服语义鸿沟问题,已经提出基于目标识别和基于中层特征的场景分类方法。然而这些方法往往需要手工设计特征,依赖专家知识和数据先验。深度卷积神经网络由于其强大的特征自动学习能力,在高分辨率遥感影像信息提取领域获得广泛关注,并被成功应用于高分辨率遥感影像场景分类。但是,目前基于深度卷积神经网络场景分类方法仍然存在以下问题:(1)依赖大量标注数据。基于深度卷积神经网络的场景分类方法,往往需要大量标注数据用于训练模型,在训练数据集有限的情况下,模型学习到的特征泛化能力差;(2)特征尺度鲁棒性不足。在遥感场景中,由于数据获取时传感器角度、高度以及地物目标自身的特性,使得地物目标在影像中的尺度呈现多样性的特点,然而卷积神经网络的训练往往采取固定单一尺度的训练方式,获取的特征尺度鲁棒性不足,对于含有极端尺度目标的场景无法进行有效识别;(3)分类器监督反馈信息不足。在遥感场景中,深度卷机网络模型的训练依靠分类器SoftMax计算分类误差作为监督信息以进行反馈传递来更新网络参数,然而遥感场景往往呈现出类内差异大,类间差异小的问题,作为一个端到端的场景分类框架,常用的分类器SoftMax通过后反馈对特征学习进行指导的过程中并不能显式增加提取特征的可区分性,因此对于由于类内差异大,类间差异小而造成的错分现象不能有效的缓解。因此,本文针对深度卷积神经网络模型在高分辨率遥感影像场景语义分类中存在的问题,分别从“样本标注—特征提取—语义分类”三个阶段开展面向高分辨率遥感影像场景分类的深度卷积神经网络模型研究。主要研究内容与创新工作如下:(1)系统总结了高分辨率遥感影像场景的特点、研究现状与存在的问题,介绍了深度卷积神经网络的基本理论方法,并详细分析了其在高分辨率遥感影像场景中的现状和应用前景。(2)在样本标注方面,提出了基于端到端的半监督深度卷积网络场景分类方法。针对深度卷积神经网络训练依赖大量标注数据问题,基于标签传递的半监督学习思想,结合深度学习的训练特点,将标签传递算法引入到深度卷积神经网络模型中,在利用少量标注样本训练网络的同时,将未标记样本纳入模型的训练,利用网络模型提取未标注样本的特征并计算未标注样本和标注样本在特征空间的相似性,根据相似性构建标签传递矩阵,通过鼓励同类样本标签传递,抑制异类样本标签传递,使得同类预测样本之间相较于异类预测样本具有更大的相似性,有效提高在有限标注样本情况下深度网络特征的泛化能力。(3)在特征提取方面,针对高分辨率遥感场景中,地物目标由于数据获取时传感器角度、高度以及地物目标自身的特性造成的尺度多样性问题,采用多尺度影像训练神经网络,提出了基于多尺度卷积神经网络场景分类方法。传统卷积神经网络往往采用单一固定尺度图像用于特征提取,学习得到的特征尺度鲁棒性差。因此,本文对高分影像尺度变化进行建模,构造多种尺度影像用于模型训练,提高学习得到的特征的尺度鲁棒性。并在此基础上,联合图像中不同尺度,不同位置处的局部深度特征进行场景分类,实现分类器层的结果融合,改善场景分类精度。(4)在语义分类方面,针对高分辨率遥感场景中类内差异大,类间差异小的问题,采用同类样本在特征空间相较于异类样本具有更小的距离这一聚类假设,提出聚类损失项,加强同类样本在特征空间的相似性,提出基于收缩卷积神经网络的场景分类方法。在遥感场景中,往往呈现出类内差异大,类间差异小的问题,本文在分析深度卷积神经网络分类器SoftMax分类原理的基础上,将SoftMax中对应于每一类的类别向量作为每一类的类别中心,通过最小化样本与其对应的类别中心之间的夹角使同类样本向其聚类中心收缩,最大化各类别中心之间的夹角使各类别中心疏离,提高同类样本在特征空间的相似性以及异类样本的差异性。(5)构建基于深度卷积神经网络的高分辨率遥感影像场景分类原型系统。结合从多个角度提出的基于深度卷积神经网络的高分辨率遥感影像场景分类方法,构建满足多种应用需求的高分辨率影像场景分类原型系统。本文研究基于深度卷积神经网络模型的场景语义分类方法,分别从“样本标注—特征提取—语义分类”三个阶段实现遥感场景语义分类研究,可有效提升高分辨率遥感影像场景语义信息提取的精度,对于实际应用中的图像检索和环境监测等领域具有重要的科学意义和社会价值。
其他文献
【正】 随着改革的深化,我们愈来愈深切地感到,“左”的影响象一个幽灵,困扰着人们的思想,阻碍着改革的发展,成为前进道路上的严重障碍。因此,从理论和实践的结合上分析当前
针对硫化氢对炼油装置造成的严重腐蚀,在实验室条件下研究炼厂高温硫化氢的腐蚀特点,仅就硫化氢的浓度、温度及腐蚀时间对渗铝钢某材料进行耐蚀性评价.实验证明:粉末包埋渗铝
在英国,教育督导被政府和教育管理部门视为最优先考虑的事项,因为它是教育治理的重要手段,是教育改进的动力源头,也是衡量国家教育先进性的主要标杆。本研究聚焦于英国教育标
近年来,随着社会经济的发展,旅游业迎来了空前的发展空间和发展潜力。一方面,主观上有赖于人民群众不断攀升的出行意愿;另一方面,客观上得益于人们生活水平的不断提高和改善。这使得旅游业呈现出多样化的发展态势,而“互联网+旅游”的兴起也成为助推旅游业蓬勃发展的内在引擎。旅游新业态的涌现不仅在一定程度上为旅游业的发展提供了动力和新的增长点,而且为传统旅游产业的转型升级提供示范效应并注入新的活力。互联网的高速
目的 探讨和分析B型尿钠肽对急性冠状动脉综合征患者预后判定的意义。方法 甲组为急性心肌梗死患者组,30例;乙组为不稳定型心绞痛患者组,30例;丙组为稳定型心绞痛患者组,30例
自然科技资源共享条例的制定应在遵循可持续发展等原则的前提下,通过共建、共享、共赢三个环节的制度设计来实现。提高自然科技资源利用效率,提高科技创新能力,维护共享各方权益
采用原油罐罐底水为介质,测定了不同含硫量、pH值以及不同温度下碳钢的极化曲线,分析了各因素对碳钢极化行为的影响.研究结果表明:碳钢在硫含量大于0.2g·L-1、pH值大于9
屯溪区是安徽省黄山市的中心城区,随着城市的发展,农村人口在过去10年下降了10%,目前只有4万多人住在市郊的农村,而且大多在城市工作。按照目前城市的扩张速度,5年内所有的农村都会变成城市。  城镇化让这些早已不再务农的“农民”得以享受城市的公共服务,受到他们的欢迎,村集体的资产也随之产生了巨大的增值。但如何管好、用好村集体资产,实现资产保值增值,让失地农民永远受益,成为迫在眉睫的问题。  湖边村是