基于深度学习的图像与视频语义分割方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:zhym821211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机软硬件水平的不断提高和人工智能新技术的快速发展,生产生活中的自动化需求也日益提高。在自动驾驶、无人机巡航等智能化任务中,环境感知与理解是核心需求之一,语义信息在其中发挥着重要作用,因此本文从实际应用场景出发,为了满足环境解析与理解任务中对语义分割的实时性和准确性需求,系统研究了图像和视频语义分割方法。针对图像语义分割问题,本文提出了一种基于自编码器的轻量级图像语义分割模型,并命名为QNet。在所提模型的编码器中,提出了基于通道分片和通道重组的特征提取基本单元,增强了通道之间的信息融合并限制了参数数量。在解码器中,提出了改进的空间金字塔多特征融合模块,通过扩展感受野来促进图像的不同区域不同大小特征图的充分融合。在实验环节,将QNet和其他图像语义分割网络在相同条件和环境下分别在Camvid和Cityscapes数据集上进行了训练和测试,实验结果表明,QNet在IoU等性能指标上优于其他方法,且在两个数据集上的图像处理速度均超过35FPS,表明QNet实现了精度和速度之间的平衡,可以用于实际场景和移动设备。针对视频语义分割问题,在图像语义分割网络QNet的基础上提出了一种基于光流法的视频语义分割框架。所提视频语义分割框架由QNet组成的分割分支和Flow Net2-s组成的光流分支组成,其中分割分支对视频关键帧进行语义分割,光流分支进行帧间特征传播和关键帧调度。在具体工作过程中,通过复用关键帧特征、减少分割运算次数的策略在保证整体分割精度的同时提高模型推理速度。为此,本文首先设计了基于光流法的特征传播策略,通过计算当前帧与前序最近邻关键帧的光流场构建此两个视频帧的帧间关联性,再将关键帧的特征传递给当前帧。针对关键帧调度问题,本文提出了基于判别网络的关键帧调度策略,可以自适应地根据视频内容快速有效提取关键帧,改善了传统的基于固定时间间隔的关键帧调度策略鲁棒性不足的缺点。在实验环节,本文搭建了QNet+Flow Net2-s的视频语义分割框架,并在相同条件和环境下在Cityscapes数据集上与其他框架进行了对比实验,实验结果验证了本文所提出的视频语义分割框架的优异性能。此外,本文在无人机巡航场景下对所提的视频语义分割框架进行了测试,所得分割效果良好,能满足一定的准确度和实时性。
其他文献
在交通、市政、水工、矿山、军事等诸多领域存在着大量的隧道工程。隧道工程的建设必然伴随着土体的开挖,由于土体对于外界的扰动较为敏感,开挖过程中所引起的地表沉降、围岩变形若是过大,必然会引起地表塌陷、洞室坍塌,从而造成人员生命及财产的损失。通常来说,隧道的施工工法及支护参数主要根据其所处地层的围岩力学参数来确定,但众所周知,围岩作为一种非均匀、非线性、非连续的材料,如何准确高效的获取围岩力学参数成为工
随着人类的“蓝色信念”日益深刻,对海洋认知的脚步加快,推动了水下运载监测装备的快速发展,作为人类重要的水下作业助手,水下机器人也在不断更新其功能和应用领域,其中小型自主水下机器人(AUV)将在未来海洋观测网络中成为重要观测节点,在未来水下机器人普及中成为主要市场需求。然而目前具备多种信息采集功能的电子系统尚没有标准化的产品,且低成本信息系统对AUV具有普及性,因此本文以小型AUV信息系统为研究对象
Lamb波是在薄板中主要传播的一种波,因而研究Lamb波在板结构诊断损伤和健康监测方面机理和技术有着重要的科学意义和工程应用价值。在板结构局部区域激发的Lamb波具有柱面波传播特点,且该波在传播过程中会有一定程度的衰减。因此研究Lamb波传播特点及波形的演变十分必要。本文采用哈密顿体系方法,分析Lamb波波形模态与该体系下本征解的关系,并借助辛共轭正交关系分解和叠加波形函数,得到波形函数表示的La
近年来,研究人员发现纳米裂纹可以广泛用于制作应变传感器,纳米裂纹应变传感器通常由带有纳米裂纹的导电层和柔性可拉伸的聚合物层组成。纳米裂纹应变传感器的性能参数包括灵敏度、量程、响应时间和迟滞等。纳米裂纹图案,如裂纹长度对纳米裂纹应变传感器的性能起关键作用,因此完成关于裂纹长度对纳米裂纹应变传感器性能影响的探究是十分必要的。为此,本文利用一种能够控制柔性基底表面金属薄膜生成纳米裂纹的方法制作出不同长度
新业态从业人员的职业伤害保障缺位,已然成为中国新时代的社会痛点之一。这一问题的表征是“平台+个人”的新型劳动关系对传统工业社会职业伤害制度的冲击与解构,本质是新业态经济下职业伤害保障平台及个人责任的划分与界定问题。在化解从业者职业风险与促进新业态经济发展的双重目标约束下,应通过新业态从业者职业伤害保障制度核心要素的规划与设计,实现制度筹资与支付的动态平衡。在现行情况之下,通过商业保险先行实现对新业
随着科学技术的飞速发展,对导航自主性与抗干扰能力提出了更高的要求,复杂干扰环境中的导航问题是当前研究的难点,而主流导航方式存在价格昂贵、抗干扰能力弱的缺点,因此亟需探究新型导航方式。目前同步定位与建图(Simultaneous Localization And Mapping,SLAM)和偏振光导航组合是一种新型导航方式,受到学者们的关注。视觉SLAM主要模仿生物视觉感知系统通过图像匹配实现导航定
在信息全球化的今天,数据是蕴含着许多信息的重要载体,如何深度挖掘数据中有价值的内容是研究者们热衷讨论的话题。在当今的大数据背景下,无论是日常生活,还是科研应用,不平衡数据随处可见,例如在医疗诊断、金融风险防范等方面,对不平衡数据的学习尤为重要。但正因为不平衡这一特性,传统的分类方法无法取得较好的结果,因此出现了各种针对不平衡数据的学习方法。目前,一种主要的不平衡学习是通过分类器与采样方法结合来提高
当今环境污染问题和化石燃料储量问题是传统能源的两大主要问题,解决方法一方面是减少传统能源的污染排放,另一方面是开发绿色环保的新能源。在目前传统能源占据能源消费大头和新能源需要时间缓冲的现状下,需要提升传统燃料的各项性能指标,比如越来越严格的排放指标。燃料的各项指标需要通过标准工况实验进行测量,比如在成品油生产过程中需要在各项工艺过程中监控各项物性指标,传统实验由于样品消耗大,耗时长,误差再现性差等
涡扇发动机以其高推进效率和低耗油率在民用和军用航空领域有着广泛应用。然而,随着飞机对推进系统性能要求的提高,涡扇发动机结构愈加复杂,系统非线性和变量间耦合特性也相应增强,因此需要探索先进控制器设计方法以满足其性能和安全要求。近年来,随着人工智能技术的发展,基于数据驱动的控制器设计方法在航空发动机领域逐渐发展。因此,本文依托某部委重点项目“XX发动机基础问题研究”,针对某型涡扇发动机开展基于数据驱动
"三线一单"管控情况评估指标体系和评估方法研究是建立健全"三线一单"成果实施评估和实施监管机制的重要基础性工作。以区域环境绩效评估的理论与方法为基础,针对四川省"三线一单"实施管控的需求,建立了四川省市(州)政府、省级政府部门落实"三线一单"管控情况的评估指标体系,提出了定量与定性相结合的评估方法。研究提出的评估指标体系和评估方法可应用于省级行政区、设区的市级行政区以及省级政府部门落实"三线一单"