遥感图像道路提取模型改进及轻量化研究

来源 :西安邮电大学 | 被引量 : 0次 | 上传用户:talen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习作为目前的热门研究内容,其在多学科交叉领域有着广泛应用。随着遥感技术的迅速发展,如何从遥感影像中快速准确地提取出其中的地物等信息,是目前遥感领域的热门话题。道路作为交通的重要组成部分,是遥感影像中一种重要的地物标志,在社会的各个领域都有着巨大应用,包括城市规划、交通管理、军事应用等方面。因此,从遥感影像中快速准确提取出其中的道路信息具有重要的研究意义。本文围绕遥感图像道路提取任务,以卷积神经网络为基础,从提高道路提取精度、轻量化及自动提取三个方面出发,进行系统性研究探索,本文主要工作及创新点如下:(1)针对目前遥感图像道路提取网络中存在的道路断连、地物标志检测错误等问题,本文设计一种基于D-Link Net结合注意力机制与链式翻转残差模块的道路提取网络SA-Link Net。其中注意力机制作用于网络深层的语义信息,能选出对道路分割任务贡献较大的特征,并抑制不相关的特征,避免其对任务产生干扰。链式翻转残差模块作用于网络浅层的空间信息,完成浅层与深层的上下文信息融合,增强模型的表达能力,因此能更好分辨道路与背景。经过在Deep Globe道路提取数据集进行测试,本文改进的网络相比于原模型能够有一定的改善,F1-score和Io U分数分别提高了0.54%和0.88%,在道路断连以及地物标志检测上有一定程度改进。(2)针对语义分割网络层数深、参数量多与计算量大,在边缘计算设备部署较为困难的问题,设计两个基于D-Link Net改进的轻量化网络模型。本文设计轻量化组件Ghost Conv Trans模块与Ghost Dilated模块。以D-Link Net网络为基础,结合轻量化组件(Ghost模块、Ghost Conv Trans模块、Ghost Dilated模块)来进行优化网络的参数量并设计两个轻量化网络G-Link Net与TG-Link Net,所设计网络的参数量都有所降低,TG-Link Net是在G-Link Net进一步轻量化的结果。TG-Link Net是在编码部分将Res Net34结合Ghost模块进行参数量优化,并结合注意力机制得到Ghost-Res Net34编码网络。G-Link Net与TG-Link Net的网络参数分别比原模型降低23.2%和85.7%,经在Deep Globe道路提取数据集上进行测试,G-Link Net的F1-score和Io U分数比原模型高0.79%和1.14%,取得了更加优秀的道路分割效果,TG-Link Net的综合性能优于经典网络U-Net,但比其拥有更少的参数量、更好的模型性能,便于在边缘计算设备部署。(3)针对遥感图像的自动提取,本文设计并开发一个具有可视化界面的遥感图像道路提取系统,从而便于使用者操作。该系统中的网络模型包括本文改进的所有模型以及对比模型,使用者可根据自己需要,选择对应的网络模型进行道路提取,可以直观对比各个模型之间不同的提取结果,比较模型的综合性能。
其他文献
引线框架作为半导体芯片的载体,是半导体封装领域所用到的重要基础原材料,主要用来保护半导体芯片免受外界物理或化学因素的损害,并同时用作导通介质。引线框架的生产方式是利用引线框架掩模在曝光机上对生产原材料(铜基板)进行曝光,将曝光后的半成品进行显影、蚀刻、电镀等工序后获得成品。若曝光环节出现的缺陷未被检出,会导致后续环节中的错误进一步扩大,所以生产厂商都会在曝光环节设立检测点。引线框架曝光缺陷尺寸微小
学位
极化合成孔径雷达是一种高精度成像雷达,可以获得丰富的目标和土地覆盖信息,极化合成孔径雷达不仅成像分辨率高,而且还具有全天候对地观测的特点,在运转时不会因为光照、气候等条件而受到干扰,甚至可以穿透掩盖物获取其覆盖的信息。合成孔径雷达这些优点使得其在农业、环境、地质和军事等领域得到了广泛应用。传统的极化SAR图像分类方法通常会忽略掉极化SAR图像像素点之间的空间信息,分类效果常常达不到预期。本文的主要
学位
学位
生物特征识别在信息安全领域发挥着重要作用,掌纹识别作为一种新型生物特征识别方式,具有低失真、非侵入性和高唯一性等优势。传统掌纹研究大多使用自然光成像系统以灰度格式获取,识别精度很难进一步提升。为了获得更多的身份鉴别信息,利用多光谱掌纹图像代替自然光掌纹图像,根据不同波长的光谱对皮肤的吸收和反射率不同,捕获每个波段中特定和互补的掌纹特征。因此,本文探讨了基于多光谱图像的掌纹融合识别方法。1.针对传统
学位
随着智能物联网时代的来临,边缘计算作为一种新的计算方式,凭借其超低时延和超高可靠性的优势被应用于各个领域。然而,传统的CPU和GPU平台无法满足边缘计算实时和功耗的需求,急需高效低功耗的平台对应用进行加速。因此,本文设计并实现了基于异构多核FPGA平台的加速器,并对设计空间进行探索与寻优,以满足上述的需求。本文的主要研究工作如下:1.卷积运算中普遍存在数据读写依赖,导致执行过程无法完全并行,而串行
学位
喉癌作为头颈部常见的癌症,其早期症状通常不明显,当其开始影响患者的生活质量时,往往已经发展到了中晚期。因此,尽早发现可疑病变,有利于病情的及时确诊和后续治疗方案的确定。目前,在喉部检查过程中广泛采用的是内镜白光成像技术,其对于发生在粘膜浅层的病变敏感度较低,窄带成像技术由于能够清晰显示粘膜浅层的微小病变,成为发现早期癌变的有力工具。但这种成像技术依赖于特定设备以及检查医师的操作,视觉感知的微妙差异
学位
报纸
极限学习机(Extreme Learning Machine,ELM)是一种训练单层前馈神经网络(Single-hidden Layer Feedforward Neural Networks,SLFNs)的机器学习方法,对于解决分类和回归问题具有明显的优势。ELM是对反向传播算法(Backward Propagation,BP)的改进,不仅有效地克服了BP算法存在的训练速度慢的缺点,而且具有很好
学位
随着5G时代的到来,快速和安全的云端数据共享正吸引着越来越多的关注。关键字搜索以其可以识别用户和搜索密文而无需解密在数据共享中起着重要的作用。然而,现有的可搜索算法有许多局限性,如强大的中心权限、匹配进程只在云服务器上执行、容易造成中心损坏和单点故障等问题,使得关键词搜索的公平性仍然是一个挑战。此外,随着互联网的不断发展和生活水平的逐步提高,对数据分享的安全性要求以不再是特殊机构的专属,而现有的研
学位
视觉目标跟踪是近年十分热门的研究方向之一,由于遮挡、光照变化、快速运动等挑战,要实现快速、准确且鲁棒的跟踪仍是一项艰巨的任务。基于深度学习的视觉跟踪算法受到了研究人员的广泛关注,并且已经产生了大量优秀的算法。但该领域仍然存在一定的发展空间,待解决的问题包含以下两个方面:首先,大多数目标跟踪使用的特征是利用现有主干网络提取到的单一特征,未关注到利于跟踪任务的关键特征,难以充分发挥网络的非线性建模能力
学位