基于深度学习的深度估计和补全

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:galahad55
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度是人类感知世界的一个重要元素,它表征了人眼接收到二维图像视觉信号以外的第三维信息。计算机视觉任务中引入场景深度信息对于诸多实际应用都是非常关键的,例如:自动驾驶中的场景理解、增强或虚拟现实中的场景构建等。现实中直接从捕获设备获取精确深度的难度较大,要么如飞行时间、结构光等方法一样成本高效率低,要么如激光雷达一样可以高效扫描但只能采集到稀疏的深度图像。因此,如何从易得的彩色图像中估计高质量的深度,以及进一步在复杂场景的稀疏深度中补全稠密深度,始终是计算机视觉、图形学、模式识别等领域的研究热门话题。由于深度任务都涉及一个从图像域映射到深度域的信息跨域问题,以及各种噪声干扰,这都给深度任务带来的较大挑战。目前还没有方法能够做到完美的获取深度图像。因此,深度估计和深度补全任务具有较大的研究意义。本文基于近期热门的深度学习技术,对深度估计和深度补全任务进行研究,即如何从彩色图像或稀疏深度图像中估计或补全出稠密深度。特别的,单目深度估计虽然数据成本较低,但信息跨域程度较大,且信息量较少更加大了其NP难问题的挑战,基于深度学习方法的性能和实用性较差,故本文所研究的深度估计方法为双目深度估计。本文针对双目深度估计现有方法缺乏几何信息表示作为跨域线索导致估计深度局部不够准确的问题,提出了一个基于几何中间表示的双分支注意力融合网络。该网络主要创新的利用网络学习表面法线作为双目深度估计的几何中间表示,并配合置信度掩膜和双分支注意力机制,得到更精细的深度估计结果。本文针对深度补全现有方法缺乏显示几何信息传播导致容易受噪声干扰且算法泛化性和可解释性较弱等问题,提出了一个基于可微几何传播的多阶段优化网络。该网络在利用表面法线作为几何中间表示基础之上,提出了创新的等深线追踪进行显示几何传播,并将其可微实现为网络层,经过置信度掩膜和深度不连续边缘的辅助,再结合全局优化,高效输出准确的补全深度。本文将所提出的两个方法在多场景数据集上进行了大量实验,与近期先进的相关算法进行了量化对比和可视化分析,结果验证了方法的有效性、泛化性和鲁棒性。本文还进行消融实验说明了网络各模块对深度任务效果的影响。最后,本文考虑实用价值,通过运行效率分析并利用网络压缩,进一步提高了算法效率。
其他文献
由于眼底视网膜有丰富的动脉、静脉以及毛细血管,所以眼底图像被广泛应用于青光眼、黄斑变性、糖尿病性视网膜病变、高血压、动脉硬化等各种心血管和眼科疾病的诊断、筛查、治疗和评估。近年来,远程医疗的发展减小了偏远地区与发达地区的医疗资源差距。眼底图像作为辅助医生和计算机诊断的主要媒介,在远程医疗中起到了重要作用。然而,困于硬件设备与操作技术要求,加上强曝光会降低病人的就医体验,基层得到的眼底图像质量偏低,
学位
人脸面部属性分析是近些年来计算机视觉领域的热门研究方向,在安防、人机交互、社交娱乐等领域都有着广阔的应用前景和市场。近些年伴随着人工智能领域的飞速发展,越来越多的深度模型被应用于人脸面部属性的分析,但是由于人脸数据广泛存在遮挡、光照、表情变化等干扰,以及现有人脸数据集中广泛存在长尾分布的现象,使得人脸面部属性的精准分析仍然有巨大的提升空间。本文针对人脸面部属性分析问题,重点研究了年龄估计、头部姿态
学位
由于遥感影像技术的不断发展,应用场景愈加丰富,针对遥感影像的目标检测算法不断受到关注。传统目标检测算法所输出的垂直矩形目标框在面对遥感影像中的密集目标、大长宽比目标时,存在无法对目标有效分离等各种问题。在此背景下,出现了旋转目标检测这一细分领域。旋转目标检测将目标以带有旋转角度的矩形框进行表示,这种表示方法可以更好地分离不同目标,更适用于对遥感影像的目标检测。而在深度学习高速发展的大背景下,应用深
学位
在世界范围内,肺癌是致死率最高的癌症之一。肺癌的及时诊断对提高患者生存率至关重要。人工诊断依赖于医生经验,而且存在耗时长、检测精度低等问题,因此计算机辅助诊断技术被应用于医疗图像。基于神经网络的肺结节检测模型可以分为两类:三维模型(Three-Dimensional,3D)和二维(Two-Dimensional,2D)模型。前者可能没有足够的图像准确构建三维小结节;后者通常会逐片处理胸部图像,检测
学位
学位
从脊柱损伤患者脑电信号解码肢体运动参数以控制机器人辅助患者运动具有重要意义,且是目前脑机接口(Brain Computer Interface,BCI)领域的研究热点之一。由于非侵入式脑电信号(Electroencephalogram,EEG)安全、快捷,因而与基于侵入式脑电信号的脑机接口相比,基于非侵入式脑电信号的脑机接口更容易被患者群体接受。实现运动障碍患者的运动辅助需要实时连续的神经假肢控制
学位
城市隧道通过开发利用城市地下空间疏解地面交通压力,具有对原有城市格局和景观影响较小、提高市内交通运行效率、降低车辆的尾气排放和减少人们出行成本等优势,因而在城市道路交通系统中得到广泛研究与应用。沥青路面以其优良的综合路用性能,已经成为城市隧道的首选路面结构型式。随着隧道交通量的增大,隧道火灾出现的频率不断增加。当隧道火灾发生时,沥青路面极易成为第二火源,并释放出大量有毒浓烟,影响人员疏散和救援行动
学位
近年来,随着经济的不断发展和社会的不断进步,人口老龄化问题逐渐加剧,摔倒给中老年人的健康带来了威胁。如何进行摔倒的自动检测以实现摔倒后的及时救治,对于保护中老年人的健康至关重要。现已提出的基于可穿戴传感器、基于环境设备、基于计算机视觉等方式实现的摔倒检测方法,可以实现较高精度的摔倒检测,但都存在一定的局限性。因此,基于无线信号的感知技术,因其非接触性和非视距性的特点,受到了研究人员的广泛关注。但在
学位
随着现代科技的发展,智能交通逐渐进入了人们的生活。智能车辆编队功能是其中一项具有广阔前景也符合时代潮流的技术,尤其是针对大型车辆的智能编队,可以提升道路安全系数、道路通行效率,并且减低能源消耗。但是车辆编队技术距离大范围落地应用还有很长的路要走,其原因之一是尚未建立完善的测评体系,现有测评标准缺乏对编队整体性能的定量评价,且对大型车辆在变道/切入过程中的横摆稳定性考虑不足。对此,本论文开展了基于多
学位
区域规划在推进区域合作、实现区域均衡发展中发挥着积极作用。近年来仅国家级区域规划就多达60余份。裁量性是区域规划的本质属性。裁量权贯穿于区域规划编制与实施的整个环节。本文旨在证成区域规划裁量概念,选择区域规划裁量的规制路径,规范区域规划裁量权运行。论文遵循“区域规划裁量概念证成——裁量权规制路径选择——行政自制原则展开”的递进式研究思路。正文由绪论和三章构成。绪论部分简要介绍了问题提出和研究框架;
学位