基于深度学习的单目图像深度估计问题研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:hello_tyj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像的深度估计是计算机视觉领域一个重要的研究课题。挖掘二维图像中的深度信息,可以帮助计算机理解场景的三维结构,在智能机器人技术、虚拟现实、增强现实、场景的三维重建、汽车自动驾驶等众多领域都有广泛的应用。相较于基于双目、多目的深度估计方法,基于单目图像的深度估计对设备和环境要求较低且易于实现,因此具有更加广泛的应用价值。然而,只通过单个视角的二维图像估计三维的立体信息,从几何计算的角度来看是非常巨大的挑战。传统的基于单目深度估计方法主要通过阴影、纹理等线索恢复深度信息,虽然实现简便,但是在特征检测和匹配过程中受外部环境限制较大,不具有良好的普适性。而基于深度学习的单目图像深度估计由于充分利用了图像中的物体结构等信息,因而具有鲁棒的特征表示以及泛化能力较好。但是该方法仍然存在一些问题:(一)物体边界信息容易丢失并且对场景结构恢复不完整;(二)复杂环境下的深度预测效果不佳,一些小尺度物体与背景融为一体,不能很好地区分二者。前者是由于传统的卷积神经网络只是通过卷积核来聚合局部区域的特征信息,缺乏对全局信息关系的考虑,而后者是因为当前方法对场景中纹理、几何信息的解析能力不足。针对上述问题,本文立足于深度学习的方法,对单目图像深度估计问题展开了以下研究:(1)本文通过加宽网络,实现在不增加模型复杂度的条件下进一步提高模型性能,然后通过加权校准的方式自适应地调整特征通道之间的重要性关系,从而提高网络模型对特征的利用率。基于此我们提出了一种基于SE-ResNeXt的单目图像深度估计网络,改善了网络的全局信息的利用问题。(2)本文通过多层级的注意力机制在网络的不同部分更有效地保留场景语义信息,在此基础上将编码器网络中提取的语义特征与解码器网络中对等层的特征进行融合,帮助网络更好地定位小尺度物体,最后通过全局特征增强模块获得更加密集的上下文语义信息。基于此我们提出了一种基于多级注意力对等层融合的单目图像深度估计网络,有效改善了复杂环境下的深度预测效果,解决了场景中小尺度物体与周围环境混合的问题。本文系统地研究了深度估计问题中的全局特征信息提取和复杂环境下的细节特征保留问题,所提出的方法显著提高了深度估计的效果和性能,并且通过大量的实验分析、论证本文方法。在KITTI数据集上绝对相对误差降至0.1,均方根误差降至4.421。实验结果表明本文方法获得了更低的误差值,并且在视觉效果上也有一定的提升。
其他文献
随着移动互联网的爆发,旅游信息产业有了长足的进步和深入发展,导致旅游数据来源不同且相对分散,知识图谱作为大数据时代新型的知识表示方式,提供了一种较好地组织和管理互联网海量信息的技术,其中,实体关系抽取是构建知识图谱的关键技术,可以将非结构化文本中的知识进行提取。本文通过对百度百科与旅游垂直网站多源数据的分析,设计了山西旅游知识图谱的模式,开展了实体及其关系的抽取方法研究。主要研究工作如下:(1)两
以信息技术赋能传统产业是国家战略,将自然语言处理技术应用于旅游领域,从而推动智慧旅游建设,成为一个重要的应用研究方向。旅游问答系统是智慧旅游建设中的一项重要内容,它旨在应用自然语言处理技术回答用户提出的问题。旅游作为一种体验型产品,其问答系统反馈带有真实主观观点的答案对用户更具亲和力。为更好地回答旅游领域的主观型问题,本文在抽取主观型候选答案的基础上,利用情感分析技术获得候选答案的情感信息,以便获
山西有着深厚的历史底蕴,是中华文化的重要发源地之一,山西博物院青铜文化是其中重要的组成部分。目前,山西博物院在文创产品开发领域尚处在探索期。为了进一步弘扬青铜文化,针对山西博物院青铜器文创产品开发进行研究是颇有必要的。笔者以山西博物院鸟兽形青铜器为文创开发原型,建立系列文创品牌《铜趣》。本文采用文献研究法、实地调查法对山西博物院青铜文化脉络进行梳理,采用问卷调查法对《铜趣》系列文创品牌进行了受众调
当今时代,信息技术日新月异,地区间的贸易往来趋于频繁,企业为在市场竞争中占据一席之地,提升自己的竞争优势,纷纷将物流外包,这就使得物流业蒸蒸日上。我国物流业在发展中也没有落下前进的脚步,尤其是十九大以来,智慧物流、区块链等平台经济方兴未艾,很大程度上推动物流行业的数字化变革,这就促使物流企业不得不面临一系列的重大改革。物流业作为新兴产业存在成本高、能耗大、污染多等一系列问题,这就导致我国物流业虽然
新型城镇化是现代化进程中不可或缺的关键一环,其作为国家的一项重要发展战略,在实现全面小康、推动经济高质量发展的道路上发挥着不可替代的核心作用。同时物流业在近年的发展中保持着强劲的增长势头,逐步成为我国经济发展的重要驱动力。新型城镇化政策涉及领域广阔,新型城镇化的蓬勃开展必将为物流业发展打开新的发展空间,因此有必要对新型城镇化背景下物流业的发展成效进行深入研究。关于新型城镇化与物流业的相关研究屡见不
随着山西省经济的快速发展、基础设施的不断完善,物流业迎来了迅猛发展的契机,相关部门和各个企业也越来越关注物流业的发展状况。经过多方的努力,山西省物流业正逐渐改变“散、小、乱、差”的局面,不断向现代物流业转变。但由于种种原因,山西省物流业仍存在诸多问题,如:物流成本一直居高不下,占山西省GDP的比重一直高于全国平均水平;物流企业的竞争力有限、信息化程度不高、资源整合的能力差等。究其原因,山西物流标准
谣言的传播过程往往存在一些随机扰动,这些扰动时刻影响着谣言的传播趋势,因此研究随机扰动下的谣言模型,对控制谣言的传播具有非常重要的意义.基于此,本文主要研究随机扰动下两类谣言模型的渐近行为.第一章,介绍了随机谣言模型的研究动态,并给出本文主要研究的内容.第二章,建立了下列随机谣言模型(?)首先,利用停时证明了该模型全局正解的存在唯一性;然后通过构造Lyapunov函数研究了该模型无谣言平衡点的p阶
交通基础设施是经济社会发展的先行资本。交通基础设施的建设和完善能够促进要素在空间范围内迅速流动,加快人力、物力、资本的自由流动速度,降低运输成本,提高流通速率。物流业的快速发展依赖于物流效率的提高,交通基础设施作为物流要素流通的载体,在一定程度上形成了物流业发展的合力和动力,所以研究我国交通基础设施对物流业发展的影响有着很强的现实意义。基于交通基础设施的外部性和网络状特性,不考虑空间效应会在一定程
机器自动情绪识别因其在人机交互中的潜在应用而受到越来越多的关注。目前,情绪识别可通过多种信息来实现,如面部表情、语音语调、身体姿态以及人体各种生理信号等。相比较而言,皮层脑电作为中枢神经生理信号,调节与情绪相关的递质分泌和大脑的边缘系统,能够客观反映人的情绪状态变化,从脑电信号中提取有效特征并进行情绪识别在人机交互和精神心理疾病监测中具有重要意义。论文针对维度情感模型的构建以及脑电信号情绪识别中特
5G网络发生故障可能影响全网稳定性和服务质量,其故障发现与修复是5G网络运维管理的关键之一。基于历史故障发生前的网元关键绩效指标(Key Performance Indicator,KPI)变化以及设备告警信息、指标统计特征、自动异常检测、指标关联特征、告警编码特征等,提出了5G核心网网元多维特征融合故障预警方法,构建了多维特征空间训练故障预警模型。最后,针对现网运行数据,选取了6类网元并进行了实