高分辨率遥感影像“像素—目标—场景”的深度理解方法研究

来源 :武汉大学 | 被引量 : 2次 | 上传用户:BlueWindow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着高分辨率对地观测技术的快速发展,高分辨率遥感影像数据量快速激增,影像空间分辨率已经从米级快速提升至亚米级。高分辨率遥感影像地物目标几何结构清晰、空间细节信息丰富的特点为高分辨率遥感影像解译提供了重要的基础。当前像素级理解(如金属材质、草地等)和目标级理解(如飞机、车辆等)是高分辨率遥感影像理解中的重要问题。然而,现有目标级理解方法只能解译到地物目标框层次,其无法跨越“语义鸿沟”直接对包含多种地物目标的复杂场景高层语义信息(如飞机场、居民区、商业区等)进行理解。传统像素级、目标级、场景级理解部分均依靠人工设计算子提取特征,特征普适性差且提取过程自动化能力有限。根据高分辨率遥感影像上由微观到宏观的地物构建层次,如何跨越影像底层特征与高层场景语义之间的“语义鸿沟”,实现高分辨率遥感影像“像素-目标-场景”深层次、自动化、一体化理解是一个亟待深入研究的重要课题。为实现高分辨率遥感影像“像素-目标-场景”深度自动理解,突破影像底层特征与高层语义之间的“语义鸿沟”问题,目前已分别提出了面向高分辨率遥感影像像素级、目标级、场景级理解的方法。但现有像素、目标、场景理解方法大多基于人工设计特征和浅层分类器,在高分辨率遥感影像理解中仍存在以下难题:(1)像素级底层信息利用不充分。传统像素级分类方法大多利用离散光谱或空间信息,依赖人工经验提取特征,空谱联合特征表达能力不足;(2)目标空间分布难以顾及。传统目标探测方法无法顾及高分辨率遥感影像目标邻近和尺度多变等空间分布,易造成目标探测漏检问题,降低目标探测性能;(3)场景高层语义提取能力受限。传统场景分类方法中特征提取步骤依赖人工经验限制了场景语义的准确自动提取。针对高分辨率遥感影像像素级、目标级、场景级理解中存在的问题,本文开展了高分辨率遥感影像“像素-目标-场景”的深度理解方法研究,主要研究内容包括:(1)系统地总结了当前高分辨率遥感影像像素级、目标级、场景级理解的相关理论和方法。本文分析了高分辨率遥感影像的数据特点以及像素、目标、场景理解过程面临的难题,并分别对高分辨率遥感影像像素、目标、场景理解现状进行了详细的总结。(2)在像素级理解方面,提出基于无监督特征学习的高分辨率遥感影像空谱联合像素分类方法。针对高分辨率遥感影像分类中的标记样本获取困难、空谱信息利用不充分、特征提取自动化能力不足等问题,提出窗-中-窗的空谱信息联合表达策略,并基于此结合无监督稀疏自编码特征自动提取和卷积池化特征表达提出无监督卷积稀疏自编码空谱联合分类器,从而提升高分辨率遥感影像像素级分类精度和自动化程度。(3)在目标级理解方面,提出顾及高分辨率遥感影像目标空间分布的迁移Faster R-CNN目标探测方法。针对特定目标探测任务中标记样本有限以及传统目标探测方法无法考虑目标邻近造成的漏检问题,提出了基于边框泛化保持Faster R-CNN的目标探测方法,在目标探测后处理阶段建模缓解目标漏检现象,同时利用迁移学习方法提升目标探测效率;针对高分辨率遥感影像上目标尺度多变造成的漏检问题,提出了基于多尺度增强Faster R-CNN的目标探测方法,分别在数据预处理层、目标探测模型内部建模考虑影像目标多尺度处理策略,提升多尺度目标的探测性能,并利用迁移学习提升目标探测的效率。(4)在场景级理解方面,提出基于深度神经网络的高分辨率遥感影像场景分类方法。针对高分辨率遥感场景分类中的无标记样本的情况以及传统基于中层特征编码的场景分类特征提取依赖人工经验的问题,借助深度学习深层次表达的有效性思想,提出在无监督单层卷积稀疏自编码场景高层语义识别模型的基础上构建无监督层次化卷积稀疏自编码场景分类模型;针对高分辨率遥感影像场景中目标尺度多变影响场景语义判定以及标记样本有限的问题,提出了顾及金字塔池化和监督信息的迁移卷及神经网络场景识别方法,利用卷积神经网络模型提取场景高层语义信息,在模型内部加入金字塔池化和监督信息提升场景分类精度,并利用迁移学习进一步提升高分辨率遥感影像场景理解的精度和效率。(5)构建基于深度学习理论的高分辨率遥感影像“像素-目标-场景”深度理解原型系统。结合针对地物不同尺度理解提出的基于深度学习理论的高分辨率遥感影像理解方法,构建高分辨率遥感影像“像素-目标-场景”深度理解原型系统。本文面向高分辨率遥感影像像素分类、目标探测和场景分类三个层次,开展基于深度学习的“像素-目标-场景”高分辨率影像理解方面的研究,针对高分辨率遥感影像的数据特点,构建满足多种任务需求的高分辨率遥感影像“像素-目标-场景”深度理解原型系统,提供不同尺度的地物理解结果,对于推动高分辨率遥感影像在农业、军事和城市规划等领域的应用进程具有重要的社会价值。
其他文献
织物增强柔性复合材料是由织物增强体和柔性基体复合而成,较好的满足了材料对质地轻、强度高、韧性和柔性好的要求,被广泛应用于军工、建筑和安全防护等领域。织物增强柔性复
1 概况安城电站是安吉县赋石水库下游梯级开发电站,引水渠道全长43km,其中主干渠长25km,渠道正常引水流量11.5m3/s.渠道沿村庄、农田和山腰绕行,渠道内生活和农业生产垃圾及
<正> 为贯彻落实《国务院批转国家经贸委关于加快农村电力体制改革加强农村电力管理意见的通知》(国发[1999]2号)、《国务院办公厅转发国家计委关于改造农村电网改革农电管理
针对传统嵌入式系统中处理器主频不是很高时,处理器自带的显示控制器难以驱动高分辨率的显示器的问题,提出一种基于SOPC的显示控制器的设计方案.通过在Xilinx公司Spartan-6系
目的观察加用葡醛内酯对免费抗结核组合药治疗HBsAg(-)肺结核患者肝功能的影响。方法2004年1月至2010年6月共治疗111例肺结核患者,按单纯随机抽样分为观察组56例,使用抗结核组合
n-soliton-like solutions of three non-isospectral equations, the non-isospectral mKdV equation, the non-isospectral sine-Gordon equation and the non-isospeetral
综述后张法的施工技术在慈溪中部八塘横江拓疏工程桥梁施工中的应用,为河道施工简便及节省造价,同时又不压缩河道宽度创造了有力条件.图1幅.
灭磁就是把励磁绕组中的磁场储能尽快地减弱到尽可能小的程度.对灭磁电阻的参数选择与磁场断路器型号选择、配合有一定的要求,否则不能达到快速灭磁的目的.叙述了灭磁原理和
老年人随着年龄的增长,肝脏再生能力、解毒、蛋白合成、肝糖原代谢等功能均明显下降。同时老年人免疫力下降,容易感染各种疾病,特别是病毒性肝炎。老年病毒性肝炎是指年龄在60岁
新庄电站在管理上实行末位淘汰制两年来,提高了管理水平,促进了公司两个文明建设的全面发展,取得了可喜的效果.提出了解决目前存在问题的办法.表1个.