面向单目深度估计的无监督深度学习模型研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:zoulin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
单目深度估计任务是指从描述一般场景的单目图像中估算深度信息,在无人驾驶、三维图像重建、机器人导航、增强现实等方面有着广泛的应用前景。但是该任务是一个典型的不适定性问题,因为一个被捕获的图像可能对应着诸多的真实场景。主流的深度估计算法主要可分为两大类:有监督深度估计方法和无监督深度估计方法。其中无监督深度估计方法由于其相较于前者避免了费力的注释和额外的校准,已成为目前的研究热点。本文针对无监督深度估计方法普遍存在的问题,诸如语义失真、边界不清、运动物体导致的投射扭曲等,通过融合不同的线索信息,进而改善无监督深度估计的性能。主要创新工作如下:(1)提出了基于语义分割的无监督深度估计模型。该模型针对现有无监督深度估计算法中普遍存在的运动物体、边界不清、语义失真等问题,对经典的无监督深度估计模型框架进行改进。该模型使用预训练的语义分割模型作为先验信息,引导生成深度特征,增强深度网络的语义信息,有效缓解了深度估计任务中的语义失真和边界不清的问题。同时,通过语义标签约束运动物体的运动信息,进而解决无监督单目任务中不可避免的运动物体导致的投射扭曲问题。(2)提出了基于空间上下文的无监督深度估计模型。该模型针对上述深度网络过于依赖预训练语义分割信息的问题,自适应地逐像素捕获全局上下文信息和局部上下文信息。具体来说,通过全局特征与局部特征之间的相似度,建立用于衡量全局上下文需求的注意力图。其反向值可以用来度量局部上下文需求。另一方面,通过对基于通道的特征图进行重新标定,有选择性地强调信息特征,再经过共现网络层对每一个像素点都依据其周围点的特征分别滤波,以此强化其边缘细节信息。通过在不同的网络层次中构建多个自适应上下文模块,以获得由粗到细的结果。为了评估所提网络的有效性,在常用的数据集上进行了大量的实验。实验结果表明上述模型均优于相关的主流方法。
其他文献
抗生素的过度使用增强了环境中细菌的耐药性,由此产生的抗生素及其耐药菌污染是目前关注较多的环境问题之一。可见光催化技术因能源可利用程度高而备受青睐。钼酸铋(Bi2MoO6)拥有独特的层状结构和相对较窄的带隙宽度,能够吸收可见光。然而,单纯Bi2MoO6的量子效率较低,光利用率不高。采用离子掺杂和半导体复合是改善光催化材料性能的有效途径。本文以溶剂热法合成Bi2MoO6(BMO),利用溴(Br)离子掺
学位
雾霾事件的频发不仅对环境造成严重污染,还威胁着居民的身体健康。而硫酸盐的快速形成是决定我国细颗粒物爆炸性增长和严重雾霾事件频发的关键因素,其形成机制多样且复杂。最近的研究表明,黑碳也是雾霾期间气溶胶粒子中最关键的成分之一,其主要来源是化石燃料和生物质燃烧,可产生多种活性中间体,对硫酸盐的形成具有一定的催化作用。在本研究中,首先收集工业黑碳并制备不同种类的生物质黑碳。采用元素分析仪测定黑碳的碳、氢、
学位
初中地理教学中,教师应重视情境教学的运用,根据课程的实际情况以及学生的学习特点以及进度制定相应的情境教学方案,促使学生将所学的知识与现实生活产生联系,以实现培养学生学科核心素养的目的。为此,本文基于学科核心素养,对初中地理情境教学提出一些实践建议,旨在提升初中地理教学水平,从而帮助学生更好地成长。
期刊
将层次分析法应用到中学地理情境教学效果评价中,构建了中学地理情境教学评价指标体系,对指标重要性进行排序,建立地理情境教学效果评价模型。以某高中地理教师一节公开课为例,进行情境教学效果综合评价,确定该节公开课的评价等级,并揭示中学地理情境教学中存在的问题,从而促进中学地理情境教学的改进和完善。
期刊
胰腺神经内分泌肿瘤是一种严重威胁人类健康的高度异质性肿瘤,其中约70%为非功能性胰腺神经内分泌肿瘤(NF-p NETS)。对于恶性等级较高的NF-p NETS患者,手术切除是临床上最有效的治疗方法;恶性等级较低的患者,药物治疗更加合适。因此,准确分级是NF-p NETS临床精准治疗的关键。目前临床上确定NF-p NETS等级主要基于对单模态影像数据的视觉评估,依赖于临床医生的个人经验和主观观察分析
学位
脑胶质瘤是中枢神经系统最常见、死亡率最高的原发性肿瘤。低级别脑胶质瘤患者的五年生存率和十年生存率分别为70%和50%,中位生存期约为6.5至8年,然而高级别脑胶质瘤患者的中位生存期仅有14个月。由于不同级别的脑胶质瘤患者预后差异极大,医生需要针对不同级别的患者制定相应的诊疗策略。另外,准确地划分出水肿区域、增强肿瘤区域、坏死区域以及非增强肿瘤区域并尽可能的将其切除能极大地提高患者的生存率。本文针对
学位
电池的储能能力使电动汽车参与智能电网调控成为可能,V2G(Vehicle to Grid)技术可利用大规模电动汽车接入电网的充放电来实现电网的削峰填谷、调频等功能。双向功率变换器作为V2G的核心技术,控制电动汽车与电网之间的双向功率流。传统控制方法下缺乏调频、调压能力,无法应对电网运行扰动。本文针对两级式双向AC-DC变换器,对虚拟同步机(Virtual Synchronous Generator
学位
输电线路的参数辨识一直是电力系统调控分析的基础,实现准确而实时的电网线路参数辨识给电网系统的调度分析提供了很大的帮助,并且对电网的安全稳定运行具有重要意义。现有的电网线路参数辨识算法大部分都采用机器学习方法,但是这些机器学习方法存在一些不足的地方。首先,机器学习算法并没有考虑拓扑结构的约束,把各节点作为孤立节点分开考虑,对于全局节点的特征信息关注度不够,导致出现干扰和噪声时,预测的准确率大大降低的
学位
印刷品表面缺陷会极大地降低印刷品质量,同时人工对缺陷的检测非常地耗时,所以高效自动地完成对印刷品表面缺陷的检测对印刷工业生产具有很高的价值。近年来基于深度学习的缺陷检测算法得到了很大的发展,其性能也远远超过传统算法。但是基于深度的检测方式需要大量人工标注的数据进行模型训练,然而在实际生产过程中,产品的次品率非常低,这就导致我们很难采集到足够数量的缺陷正样本进行模型训练。此外,对缺陷正样本的标注十分
学位
无监督视频目标分割的旨在无需引导的情况下自动分离视频帧中的主要前景和背景,并输出像素级的精确分割。无监督视频目标分割在视频编码、场景理解等领域具有重要意义。随着深度学习的兴起,出现了大量基于卷积神经网络的无监督视频目标分割算法,并取得了重大进展和突破,但这些方法仍然受到复杂场景和模型计算代价的限制。本文从运动估计和外观信息出发,探讨了如何构建双流网络来解决上述问题。成果如下:目前流行的无监督视频目
学位