基于修剪策略的遥感图像目标检测方法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:lovechenhua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着相关技术的发展,遥感图像的分辨率大大提高,图像中包含更多的细节信息,这对目标检测模型的检测能力提出要求。目标检测后的信息,可为如城市规划、环境保护、农作物监测、洪水和防火等任务提供帮助。由于高分辨率遥感图像中复杂的背景信息、噪声干扰、天气影响、照明强度等因素,使目标检测工作面临更多挑战。目标检测是图像解译中最基础的任务。近年来,卷积神经网络CNN(Convolutional Neural Network)在视觉领域表现优秀。卷积神经网络在设计之初,是受图像处理中的卷积操作启发,因此相比其他领域,CNN在处理图像问题时,表现更加优异。深度学习技术的一个特点是需要大量的训练数据,而遥感技术的进步使高分辨率遥感图像更易得,这为将CNN应用于遥感图像目标检测提供可能。与地面拍摄图像相比,高分辨率图像具有不同特征:(1)背景复杂,图像包含的地域广阔,会有各种各样的地物背景;(2)物体通常较小,对于一张几千乘几千的图像来说,目标可能就是十几乘十几像素,而背景占比大;(3)由于拍摄角度单一导致目标外观变化小、旋转多;(4)地面采样距离(ground sample distance,GSD)不同导致物体具有不同尺度。当前许多遥感图像的检测工作开始使用深度特征,但将CNN用于遥感图像检测时没有全面考虑上文提到的图像特有特征,以及CNN在处理遥感图像时的缺陷:(1)CNN不具有旋转不变性,其池化层可使目标的轻微旋转对检测结果无影响,对于大角度的旋转不能保持结果不变,而遥感图像中目标旋转性强;(2)从低层到高层,特征图将会逐渐减小,并丢失精确的位置信息,而遥感图像中都是小目标,定位时更依赖于低层特征图中位置信息;(3)CNN参数量大,并具有计算密集的特点,虽然高分辨率图像数量随着相关技术的发展有所增加,但遥感图像训练集相对于地面拍摄图像训练集仍然较小,因此需要考虑如何匹配网络与训练集大小以及计算量的问题。此外,当前遥感领域许多工作在提取候选区域阶段,仍在使用Edge Boxes、选择搜索等方式,其缺点是:(1)使用手工特征,表达能力较弱;(2)模型要提取大量的候选区域,耗费的时间是惊人的。针对以上问题,我们提出基于修剪策略的遥感图像目标检测PSTD(Pruning Strategy based Target Detection for Remote Sensing Image)方法。为提高计算效率,本文提出采用自主学习的方式构建网络架构,具体采用修剪策略对网络进行修剪,然后将这种稀疏网络的方法用于目标检测网络,从而构建稀疏的网络架构,加速网络的运算速度。同时我们对原训练集进行处理,让网络能平衡学习目标与背景信息。本文主要由以下几部分工作构成:(1)遥感图像和目标检测的背景综述。首先对目标检测模型近年的发展状况进行阐述,介绍了从两阶段到端到端的典型目标检测模型及每种模型的优缺点。然后对遥感图像的成像及处理技术进行简介。(2)提出Sparse CNN算法。我们首先阐述卷积神经网络具有的冗余性缺点,冗余是由于网络参数量和数据集中图片数量不匹配造成的,针对此缺点我们提出稀疏卷积神经网络(Sparse CNN)算法。(3)提出PSTD方法。针对遥感图像训练集相对较小的特征,利用稀疏卷积神经网络算法,设计训练目标检测网络的算法,从而使网络与遥感数据更匹配,运算速度更快。然后使用多层特征图的方式解决遥感图像的目标小、尺度不同的问题。对于遥感图像背景占图像比例大的特征,使用平衡采样,难分负样本挖掘(hard negative mining),来增加网络的表达力。最后,对于遥感图像的旋转特性,使用数据增强的方式解决。(4)为验证提出的遥感图像目标检测方法的性能,设计实验从精确度-召回率曲线、平均运行时间、平均精确度和m AP,来定量评估模型,并设计实验评估Sparse CNN算法的修剪能力。实验结果表明Sparse CNN算法可较大程度修剪网络,PSTD在遥感数据上具有较强的检测能力。
其他文献
肺癌是世界上最常见的恶性肿瘤之一,其中非小细胞肺癌(non-small cell lung cancer,NSCLC)占所有肺癌病例的85%。由于NSCLC早期阶段的无症状性和缺乏有效的筛查方式,约75%的患者被发现时已处于中晚期,因此迫切需要新的生物标志物(相关基因)来用于NSCLC的诊断、预后和药物反应。本文以NSCLC的生物学数据作为研究对象,设计NSCLC相关基因编码蛋白质序列的聚类算法、
随着我国铁路建设的快速发展,大量的高铁车站也兴建而成,而新建的高铁车站大多采用无站台柱雨棚(以下简称“无柱雨棚”)的形式。无柱雨棚属于大跨度空间结构且周边未封闭,它具有体量巨大、造型新颖、形体复杂、大空间等特性。由于这些特性的存在,结构的刚度和阻尼较低,对风的敏感性也更为突出。这就对无柱雨棚的抗风、抗雨能力有了更高的要求。目前在建立无柱雨棚结构的理论研究与结构计算中,风荷载为主要设计荷载,极少考虑
图是表示一些事物或者状态关系的表达方法。由于许多问题都可以归并为图的问题,因此出现了很多与图相关的算法。图论算法为很多问题都提供了有效,简单,且系统的建模方式。图论模型可以利用矩阵描述并通过线性代数及矩阵理论知识来分析和求解,其表达形式简洁但富有概括力,同时便于进行深入理论分析。很多问题都可以转化为图论问题,然后用图论的基本算法加以解决。其在机器学习的无监督聚类及有监督的类分布学习等方面中得到了广
目前我国已在七个省市开展碳排放权交易试点,并计划于2017年启动全国碳排放交易体系。电力行业是我国最主要的碳排放源头之一,也是实现国家节能减排目标的主力军。碳交易的实
目的:研究唑来膦酸(zoledronic acid)对晚期前列腺癌患者内分泌治疗中骨代谢相关指标水平的影响,探讨该药物在影响骨代谢相关指标中的作用,包括骨密度(BMD)、血清钙离子、血
电网的广域监测与控制技术在保障供电可靠性、维护电网的安全可靠运行中担当着重要的角色。目前,基于同步相量测量装置(PMU)的广域监测系统(WAMS)在主网中已经得到了较为成熟
在较多决策问题中,决策者在给定元素的隶属度时常常在几个可能值之间犹豫,并且不同决策者提供的可能值数目通常不同.为解决此类问题,Torra提出了犹豫模糊集的概念.犹豫模糊集是模糊集的一种全新扩展,它将元素的隶属度由区间[0,1]上的一个数推广为[0,1]上的一个子集.因此,犹豫模糊集可以有效地刻画决策中专家的犹豫性.本文主要讨论了犹豫模糊集的格结构,并将犹豫模糊集上的偏序扩展到非空有限向量组成的集合
本论文以乙醇酸乙酯为起始原料,经过肼解,闭环,类Williamson醚化,以及酰化反应,得到含磺酸酯结构的1,3,4-噁二唑类衍生物4和含羧酸酯结构的1,3,4-噁二唑类衍生物5。所合成的目标化合物经1H NMR、13C NMR、19F NMR和ESI-HRMS技术表征。本论文测试目标化合物对水稻白叶枯病菌(Xanthomonas oryzae pv.oryzae)和柑橘溃疡病菌(Xanthomo
拟南芥子叶表皮细胞(cotyledon pavement cell,PC)是一种具有特殊形态的细胞,类似于七巧板形状,呈现相互交错的嵌合状态。据报道,子叶表皮细胞的嵌合状态是通过调控细胞的各向异性生长而形成,受ROP小G蛋白(Rho-related GTPase of plants)的调控,主要是ROP2和ROP6蛋白的作用。另有报道发现两种蛋白:ECH(ECHIDNA)和YIP(YPT/RAB
目的:本研究通过检测心房颤动(房颤)患者外周血淋巴细胞β3肾上腺素受体(β3-AR)的表达水平,探索β3-AR表达水平对房颤的预测价值。方法:1、研究对象:选取经临床确诊的98例房颤患者作为房颤组(35例阵发性房颤患者,33例持续性房颤患者,30例永久性房颤患者),并选择31例门诊健康体检成年人作为对照组。2、研究方法:收集两组受试者的一般临床资料及相关实验室指标。采集研究对象的外周血标本,分离淋