基于深度学习的全景分割算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:yishu888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像的全景分割是图像分割领域近年来新提出的一项任务目标,其目的是对图像中每个像素进行类别预测,并对属于实例对象的像素进行实例区分。其任务综合了语义分割与实例分割的特点,是实现全面场景解析的关键一步。在自动驾驶、生物医学、智能机器人等领域有着广泛的应用前景。然而当前全景分割技术依然处于探索研究阶段,许多技术还不够成熟。现有的全景分割技术在实时性与准确率上难以达到工业水准。由于语义分割与实例分割任务在实现技术上存在着较大的差异,难以通过一个单一的网络完成两个分割任务的统一,导致全景分割的实时性与准确率难以得到突破。本文通过对子网络的深入研究,提出全景分割算法的优化方法。本文主要的研究内容和创新如下:1.基于语义流的全景分割改进方法。针对图像全景分割过程中由于“卷积池化——反卷积上采样”所导致特征像素难以精确匹配到原图的像素级难题,构建了基于语义流的特征对齐子网络,优化特征上采样过程。利用语义流模块构建特征共享网络,为子网络提供共享特征,再对子网络中的特征图进行语义流对齐,使网络中的高层语义特征能更好的传递到低层特征中,实现从卷积到反卷积之间的像素——特征——语义之间的像素级对齐。2.设计语义注意力模块与实例注意力模块、语义辅助实例分割等方法优化全景分割网络。针对图像语义分割及实例分割、语义提取等多任务采用网络框架串联的方式,难以有效利用不同网络中的同一场景下关联信息,在网络冗余性难以消除的前提下,其准确率也不能获得最佳效果。构建以全景语义为主的网络框架结构,设计语义注意力与实例注意力,使子网络更加合理地运用网络共享特征,进行各自分割任务;构建语义辅助实例网络结构将背景语义特征与前景实例特征相融合,更加合理的利用图像上下文的语义信息,提升框架对全景分割及语义抽取的准确性。3.实现嵌入式系统下全景分割的算法落地。在嵌入式系统下实现算法的优化与改良,研究全景分割算法应用前景与实用价值。经实验验证与对比,本文提出的方法具有较好的适用性与泛化能力,本文搭建的全景分割系统在多个标准数据集上测试结果均优于当前主流的全景分割方法。
其他文献
基于相敏光时域反射仪(Φ-OTDR)的分布式声波传感系统(DAS)被广泛应用于安全监测。真实环境中振动源时变与干扰时刻存在,导致采集的DAS传感信号比在安静环境或实验室环境中更易出现未知畸变和冲击,这意味着实际环境中信号实际蕴含的振动模式易被其它干扰振动源的振动模式掩盖,信号特征易被其它干扰振动源的特征模糊化甚至擦除,使得时变、多振源干扰的复杂环境下振动源识别难度大,识别率亟待提高。为了解决这一问
正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)作为一种多载波调制技术,以其高频谱效率、对多径效应的鲁棒性、以及基于快速傅里叶变换的可实现性而备受关注,目前已经在现代通信系统中得到了广泛应用。然而,在OFDM系统中,较大的信号包络波动是其主要的缺点。由于发送端的放大器(Power Amplifier,PA)的线性范围有限,若信号峰值过高
随着互联网的迅速发展以及用户的激增,网络流量数目正在攀升,网络环境也变得日益复杂。为了实现网络管理和网络安全的需求,网络流量分类技术研究的重要性越发凸显,但传统的流量分类方法已经不能适应现代互联网的发展趋势。而随着人工智能领域的蓬勃发展,越来越多的研究者开始将机器学习技术应用在网络流量分类方法的研究之中。虽然已有很多研究为网络流量分类领域做出了有价值的贡献,但仍存在着一定的问题。真实网络环境中,获
语音关键词检测是近年来新兴的、热门的一项技术,此项技术能够从环境中检测特定的语音内容,目前已经得到了广泛的应用,比如智能音箱、语音助手等。近年来,由于神经网络在各个领域的成功应用,这也极大地促进了语音关键词检测技术的发展。尽管当前主流的关键词检测技术在预置关键词上已经能够获得极高的识别准确率,但是却仍然存在无法支持用户自定义关键词,或者在自定义关键词准确率极低的问题。为了解决上述问题,本文创新性地
在众多物联网的新兴技术中,数能一体化网络技术由于其能够延长能量受限节点的寿命,受到了相当大的关注。而自适应调制、发射功率控制等链路控制技术能够在不同信道等环境条件下,通过调节链路控制方案,来提高吞吐量、可靠性等性能。因此,在数能一体化网络这种新型通信网络中引入自适应链路控制技术是很有必要的。在过往的数能一体化网络技术的研究中,很少研究涉及自适应调制、自适应功率控制、自适应能量传输控制以及自适应多用
在机器学习领域内,随着近年来训练样本数量爆炸式提升以及训练模型的不断增大,单机性能难以支撑人们的训练需求,分布式机器学习成为了越来越多研究者的选择。在分布式机器学习中,训练任务由服务器集群完成,集群中的不同工作节点之间需要共享局部数据并聚合局部模型。因此,相较于单机机器学习,通信量的大幅提升是分布式机器学习平台的重要特点。对分布式机器学习平台通信调优也成为了提升其效率的一大关键。目前已有的分布式机
机器学习与深度学习已经在人类各个领域展现出了优异的表现,然而这是建立在大规模的数据收集与数据标注的前提下,数据标注非常昂贵,为了减少成本,需要用到迁移学习。在缺少标注的情况下,利用有标注的相近数据集进行知识的获取,并将获得的知道迁移到无标签的相关数据集,以达到知识复用的目的。将源域的知识应用于目标域,这在迁移学习中被称为领域自适应,是迁移学习中的核心问题也是本文关注的重点问题。本文利用生成对抗网络
知识图谱应用广泛,不仅是许多NLP(Natural Language Processing,自然语言处理)子任务的上游任务,还是推荐系统、问答系统中的重要组成部分。但主要来源于各类百科的结构化图谱存在大量缺失的关系,而经过关系抽取的图谱存在许多错误元组,这些问题影响了图谱应用系统的正确性。为解决以上问题,知识图谱推理(Knowledge Graph Reasoning,KGR)算法可用于对不完整的
在人工智能、5G技术高度发展的今天,室内定位技术越来越成为人们生活、工业生产、智慧城市建设、安防领域的刚需,起着举足轻重的作用。当下各类室内定位技术百花齐放,例如,基于无线通信、惯导、激光雷达、视觉等的室内定位技术。但室内定位并没有像室外定位技术一样形成统一化、标准化。传统的基于纯惯导定位系统可不依赖部署设备实现自主定位,但惯性器件的固有漂移导致定位结果存在有累积误差。地图匹配数据融合算法通过地图
近年来,随着行人检测技术的应用场景不断增多,其研究的价值和意义也越来越大。由于深度神经网络在行人检测任务中表现出良好的性能,目前大部分行人检测都采用基于深度神经网络的算法实现。然而深度神经网络存在参数量和计算量大的特点,在一些资源有限的小型终端设备中难以进行应用。针对这个问题,本文首先提出了一个基于轻量级神经网络的行人检测算法,包括两个技术点:两阶段轻量级行人检测网络和自适应区域聚焦技术。两阶段轻