基于深度学习的深度信息估计与理解研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:haofan555888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度估计长久以来一直是计算机视觉领域的一个重要底层任务,从图片中预测每个像素的深度值对于多种现实世界中的下游任务,比如车辆自动驾驶,场景三维重建,增强现实以及机器人操作都有着重要的帮助。但是,直接从生产端拍摄的单张或多张图像中直接估计深度面临多方面的挑战,例如如何快速有效地预测准确的深度,如何在缺失大量真实的训练数据集的情况下进行神经网络的训练,如何高效利用深度信息辅助下游任务的进行。对于这些任务的深入研究对于相关科学领域的发展以及工业界的多种应用落地都有着重要的意义。本文重点关注于基于图像视觉技术的深度估计算法的改进,以及利用深度估计算法辅助其他下游计算机视觉任务的性能改进。本文在两个大的方向上进行研究-无监督的深度估计算法的研究以及对于深度信息的应用研究。有监督的深度估计算法基于深度相机等外部设备获得的准确深度图像作为监督,训练单目或者双目深度估计网络预测准确的深度。首先,有监督的深度学习面临的问题主要是如何提高算法的准确度和算法的运行效率;然而在现实世界中,获取真实可靠,且大量的深度信息标注数据是一个非常困难的挑战,不仅仅是因为大量的人力物力的消耗,更有现阶段的深度相机本身的物理局限性的原因。因此,如何通过相邻或双目图像之间的自身视觉约束来实现无监督的深度估计算法,对于科学和工业界都有着重要的意义。其次,对于深度估计算法模型和训练本身的改进外,本文对于如何利用深度信息、提取深度信息中的特征辅助其他下游任务的应用也进行了深入的研究和探索。具体而言,本文对于如何例如深度信息在物体位姿估计这一下游任务上提高准确度进行了详细的研究。本文的主要研究内容如下:1.研究了基于自蒸馏的训练方式的无监督单目深度估计的问题。针对传统的无监督单目算法的一阶段方案无法高效预测准确深度的问题,首先提出一个两阶段的无监督单目深度估计算法。第一阶段采用传统的全卷积网络预测单目图像的深度,第二阶段利用第一阶段预测的深度进行改进获得精细的深度图。其次,针对自监督二阶段网络缺少合理的监督的问题,提出一种自蒸馏的损失函数。自蒸馏损失模拟传统蒸馏算法的监督方式,不过区别于传统蒸馏算法使用独立的老师、学生网络,我们的自蒸馏损失将整个二阶段网络看作老师网络,并用老师网络预测深度值作为监督约束第一阶段的预测深度值。本文提出的自蒸馏算法中,老师网络可以利用学生网络的粗糙预测作为初始结果来取得更好的估计,并且学生网络在老师网络的监督下也可以进一步得到提高。实验表明本文提出的自蒸馏无监督单目深度估计算法,可以在不增加推理阶段网络花费的时间和模型参数的情况下提高算法的性能。2.研究了利用无监督单双目深度网络的特性互相促进两种深度估计网络的准确度的问题。针对自监督单目深度估计难以利用双目相机系统的特性估计准确深度的问题,提出了一个遮挡感知的蒸馏模块,利用双目深度网络的预测结果作为伪标签监督单目深度估计网络训练的结构。虽然双目深度网络也是通过无监督的方式训练的,但是预测的深度要远好于直接无监督训练的结果,提高了单目深度估计的准确度。针对无监督双目深度估计在遮挡区域表现较差的情况,提出一种遮挡感知的融合模块结合单目深度估计与双目深度估计来提高深度估计准确度。单目深度估计算法在双目图像中由于视差遮挡造成的遮挡区域的预测结果好于双目算法的预测效果,而在未遮挡区域,双目算法的效果要好于单目的深度预测网络。实验表明本文提出的单双目深度估计互惠互利的训练方式,可以在不增加额外训练量情况下同时提高两者的性能。3.研究了利用深度信息建立密集对应估计物体位姿的问题。针对仅依靠图像信息无法获取更深度的特征的问题,提出一个将深度信息转为点云再提取逐点云特征的算法。计算的点云特征会与图像特征一起用于物体位姿估计的计算。针对仅依靠数个关键点无法应对遮挡等复杂场景位姿估计的问题,提出基于密集对应的位姿估计算法。该算法首先会利用结合的点云与图像特征对于每个像素预测对应的物体模型的对应点,建立密集的点对应对,再直接利用最小二乘法算法计算物体的六自由度位姿。实验表明基于深度信息和密集对应的位姿估计方法,可以在严重遮挡的情况下提高位姿估计算法的准确度。对于上述研究内容,本文提出的多种算法得到了领域内的认可,这对于进一步提升深度估计的算法和应用都有着促进作用。
其他文献
智能电网作为一种新兴电力技术,将逐步取代传统电网,成为未来电网的发展方向。随着形式多样的可再生能源、电池能源存储系统等新型分布式能源的引入,智能电网的供电侧呈现多元性、间歇性、随机性等特点。与此同时,随着新能源汽车以及智能楼宇等新型用电单元的出现,智能电网的用电侧呈现多样性、随机性、灵活性等特点。因此,智能电网背景下能源管理与需求响应的优化运行面临新的挑战。解决智能电网能源管理和需求响应问题通常转
学位
并合和恒星形成是驱动星系质量增长演化的两种主要机制。目前对星系并合方面的研究主要在:(1)并合对恒星形成和AGN活动性的影响;(2)星系的并合率随红移的演变关系和对不同类型星系形成的影响;(3)通过数值模拟来研究星系的并合过程、并合参数和宿主星系的性质。对宇宙中真实的星系并合系统的并合参数及与星系整体演化的内在关联方面的研究却比较少。在本文的第一个工作中,我们对一个log(M*/M☉)≥9.5红移
学位
伴随人口老龄化加速发展及老龄人口规模的迅速扩大,为满足不断增长的养老服务需求,从量和质上增加养老服务供给、调整供给结构已经成为亟需解决的重要社会问题,而居家养老服务发展是养老服务体系的重要组成部分,也是当前国家老龄事业发展的重要内容。2017年国务院印发了《“十三五”国家老龄事业发展和养老体系建设规划》的通知,明确提出“按照供给侧结构性改革的要求,要大力发展居家社区养老服务、加强社区养老服务设施建
学位
大型涡轮盘是重型燃气轮机的核心部件,其制备技术难点主要在于大规格均质化合金锭的制备以及涡轮盘锻件的模锻成型两个方面。得益于我国800MN模锻液压机的设备能力,大型涡轮盘锻件的模锻成型能力问题得到了有效解决,而大规格均质化合金锭的制备成为了当前最迫切需要攻克的难题。此外,与航空发动机1000-3000h的寿命要求不同,重型燃气轮机要求稳定服役20000h以上,因此,提高涡轮盘材料的长时组织与性能的热
学位
前体RNA经过加工形成成熟的RNA。RNA转录物经过5’加帽、3’末端加工、剪接和修饰;并在协同转录和转录后加工过程中形成动态二级结构。与编码RNA一样,非编码RNA(nc RNA)也经历了广泛的加工。转录组研究揭示了RNA在协同转录和转录后水平在调控基因表达、植物发育和植物-环境互作中的作用。植物可以在转录和转录后水平响应胁迫应答。干旱胁迫能够引起植物形态、生理、生化和分子等特征的改变。不同植物
学位
航空发动机主轴承在高温、高速、重载的苛刻环境下服役,采用具有优异高温硬度、尺寸稳定性和耐磨性的高温轴承钢制造。高温轴承钢凝固过程中由于合金元素(C、Cr、Mo、V)的偏析,极易形成超大尺寸的一次碳化物,在服役过程中作为疲劳裂纹的萌生源导致轴承发生疲劳破坏。因此,高品质高温轴承钢的制备是实现高端轴承长寿命、高可靠性制造的保障。为制备大尺寸、均质化的高温轴承钢坯料,本文提出利用金属构筑成形技术避免金属
学位
气候变化和全球变暖是人类面临的重要环境问题,对人类生存和健康构成巨大威胁,在此背景下,中国提出碳达峰和碳中和目标。汽车排放召回符合当前我国低碳经济发展的要求,也是践行碳达峰、碳中和的务实之举。逐级降低汽车大气污染物的排放量是重要的发展趋势,汽车排放召回将对防治大气污染发挥重要作用。汽车排放召回的顺利实施依赖监管部门、企业和消费者的三方配合,其中消费者积极主动地参与汽车排放召回十分重要。然而,汽车排
学位
在化石能源日益消耗和环境污染不断加剧的背景下,研发符合可持续发展理念的新型清洁能源是迫在眉睫的任务,氢气(H2)因其有高热值、低污染、来源广的突出优势,成为新能源中的最佳候选。随着电化学技术的高速发展,电解水制氢吸引了科技界和产业界的广泛关注,电解水过程包括析氧反应(OER)与析氢反应(HER),高活性的电催化剂在电解水过程中可以有效降低能耗。OER是一个四电子转移过程,动力学较为迟缓,是电解水制
学位
生物为了适应极端的生存环境,进化出了许多独特的液体操纵能力。受这些行为的启发,多种基于激励响应材料的主动式液滴操纵方法被开发出来,并成功应用于精细化学和生物医疗等领域。其中磁响应微结构表面可以在磁场激励下发生可逆变形,从而实现对液滴的主动操纵。但是,现有的基于磁响应微结构的液滴操纵方式灵活性差,且只能在单一平面内操纵液滴。磁响应微结构表面的制备方法也十分繁琐,进一步限制了磁激励液滴操纵的实际应用。
学位
风积沙路基的处理一直是沙漠公路建设面临的难题,土工格室加固方法可为沙漠公路建设提供一条新路径,结合S21线(乌鲁木齐-阿勒泰)沙漠公路路基现场试验,研究不同路基深度动力响应特征,对土工格室加固风积沙性能探究具有重要的价值及意义。结果表明:(1)测试车速对路基不同深度处动应力、动加速度和动速度的时程曲线波动性影响较大,且提高车速时,动速度峰值、动加速度峰值和动应力峰值都出现了明显的增加;(2)随着路
期刊