单目无监督深度估计干扰消除方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:shirley09liu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景的深度估计是三维世界目标检测、识别和理解的前提,是计算机视觉的重要任务之一,也是机器人导航、虚拟现实与增强现实等领域不可缺少的关键技术。本文对比了激光雷达、双目与单目视觉深度估计的优势与局限后,采用了安装便捷、使用灵活和价格便宜的单目摄像机作为传感器,基于视频序列的无监督学习方法来估计场景的深度信息。本文针对单目视频序列无监督深度估计方法中光照变化、区域平坦相似和相互遮挡造成的干扰,研究深层神经网络训练中排除干扰的方法,以提高深度估计的精度。本文首先对比分析了基于深层神经网络模型的深度估计方法,明确了单目视频序列深度估计要解决的关键问题,针对光照变化、区域平坦相似和相互遮挡造成深度预测的误差,确定了从数据处理和目标损失函数两个方面来同时消除深度估计的干扰,设计了误差修正方法,让误差较大的图像区域尽可能不参与网络训练,从而避免干扰,提高深度预测的准确性。其中的主要原理是,源视角(目标视角)转化到目标视角(源视角)后的深度图像与目标视角(源视角)预测的深度图象之间的差值作为修正权重模板,差值越大的部分说明深度预测误差越大,则这部分像素参与计算的权重越小,用该模板修正输入图像序列,来降低深度估计网络和摄像机姿态估计网络的干扰。该权重模板也同时用于修正图像一致性约束。二者分别从数据源头和网络的目标函数着手降低干扰,获得了准确的深度估计结果。在具体实现方面,剔除输入数据干扰时,更改了网络使用的数据结构,跟踪记录每次训练得出的权重系数,在一对图像输入网络之前,分别用权重系数与两幅图像相乘来修正输入数据。为此,本文设计两套权重模板来表征源视角图像到目标视角图像和目标视角图像到源视角图像的匹配关系。当同一像对多次重复输入模型进行训练时,程序就会动态更新两张权重图,不断突出图像中干扰较少的区域,从而提升姿态估计与深度估计网络的表现。这种交替更新的处理方法不仅能消除前后两批数据之间的干扰,而且由于序列图像的前后递进关系和姿态估计与深度估计的耦合关系,也保证了整个视频序列干扰的消除。最后,本文采用两个自编码器结构的残差卷积神经网络,搭建了干扰消除的摄像机姿态估计任务和深度估计任务,在国际上最大的自动驾驶场景数据集KITTI上开展了深度测试实验,得到了各个场景下的深度图像,验证了本文方法的正确性。与目前单目视频序列无监督深度估计方法相比,本文方法也取得了相当不错的结果。以上测试实验表明本文算法在消除光照变化、区域平坦相似和相互遮挡的干扰后,保证了深度估计的准确性。
其他文献
硅/有机杂化太阳能电池有望充分利用硅材料优良的光电性能和有机光电子材料成本低、易加工,其光电性质可通过分子结构裁剪来实现多样化等优势来制备低成本、高效率的新型太阳能电池。本论文采用密度泛函理论模拟计算硅与不同电子传输材料之间的间距来挑选合适的有机物;在理论计算的基础上,进一步通过实验研究验证了理论计算的结果。此外,本论文还研究了水浴加热法制备参数与硅微金字塔结构的尺寸、均匀度等关系,实现了硅微金字
中高压直流输电、新能源分布式发电、储能设备以及直流负荷的快速发展与成熟,对中高压直流配电网的应用提出了迫切的需求。直流固态变压器(DC Solid State Transformer,DCSST)作为中高压直流配电网应用中的关键环节,受到了国内外学者的广泛关注。目前来说,DCSST的拓扑结构普遍采用双有源桥变换器(Dual Active Bridge,DAB)的串并联,但是该结构无法实现冗余设计和
面部表情中包含大量信息,其识别技术赋予计算机感知人类情感的能力,在教育、医疗、安全、驾驶员疲劳监测、机器人等领域中有大量应用,具有重要的学术和应用价值。在人脸表情
城市供水管网具有易发生漏损、爆管的特点,且故障难以快速定位和检修。结合国内外的研究现状,本文从系统科学的角度出发,通过提取拓扑结构的特征及结合其工作原理,将复杂交错
自然语言文本的否定语义是一种普遍而复杂的语言现象,通常用于表示人们对某一观点的态度。否定表述通常包含一个否定触发词(如“不会”),该词针对表述本身或其某一方面的语义
钙钛矿发光二极管因其广泛的光谱可调性,可低温溶液加工以及较高的色纯度而在显示和照明方面有良好的应用潜质。在传统的三维钙钛矿中引入长链铵离子,可获得具有多量子阱结构
清朝末年是一个充满矛盾和斗争、社会发生急剧变革的时期。激荡的历史转折、严重的社会危机,唤醒人民面对现实,中国人民逐渐认识到封建传统教育已无法适应这“千古之一大变局
自由空间光通信技术的发展越来越迅速,特点是传输速率高、抗干扰能力强、大容量、保密性好等优点吸引着越来越多的研究者开发其在不同应用领域的潜力。光束在穿过不同大气湍
随着人力成本的升高以及自动化水平的不断提高,自主导引车(AGV,Automated Guided Vehicle)在自动化的仓储物流系统中应用越来越广泛。一个完整的AGV仓储物流系统包括多个部分:调度系统、AGV控制系统和通讯系统等。AGV作为系统的执行器,需要根据任务到达相应的位置完成对应的操作。本文以叉车式的AGV为研究对象,对其中涉及的定位、路径跟踪的问题进行研究,设计实现了相应的车载系统控
城市供水系统保障城市生产和水厂制水需求,短期需水量预测是保障供水系统供需平衡、管网安全运营、节能优化调度等工作的基础和前提。目前在供水管网水量预测领域,对清水供水