基于深度学习的单目多视角深度估计

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:stieyin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机软硬件的发展,人工智能热潮兴起,自动驾驶、移动机器人和无人机等技术成为当前的研究热点。这些智能化应用依赖于对环境信息的感知,例如获取环境中障碍物与自身的距离,即深度信息。相机以其成本低、体积小、质量轻和获取信息丰富的优势成为受青睐的深度传感器。单目深度估计恢复出的深度图,可以作为机器人与无人车避障与导航的指导信息,也可用于三维重建与增强现实等领域。因此,这项技术成为了计算机视觉与机器人学中重要的研究课题。基于传统三维重建的算法通过极线搜索或三角测量等几何方法计算深度,但是难以解决图像弱纹理区域的深度重建,无法得到完全稠密的深度图。而基于深度学习的方法目前还不成熟,仍面临算法可靠性不高,精度有待提升,泛化能力较差等问题。
  本文提出了一个基于深度学习的单目多视角深度估计方法。我们的深度学习模型由紧密连接的光流网络和深度网络组成,两个子网络通过不同尺度的光流与深度转换模块连接在一起。光流网络获得的匹配信息,可以通过我们设计的转换模块得到深度信息作为深度预测的指导,而深度网络得到的深度信息也可以转换为匹配信息输入光流网络进行优化。通过不同尺度上的光流与深度的多次转化,两个网络紧密耦合,得到同时优化。在预测光流时,我们通过使用本文提出的极线特征层加入相机位姿的约束,使得预测结果在静态场景下得到提高。同时,我们的网络可以扩展到输入任意数量的不同视角图片,估计参考图像的深度图。
  在六个公开数据集上的实验表明,我们的方法能够得到比现有算法更优的深度估计结果,并且算法耗时少于大部分现有的深度估计方法。同时,网络输出的光流精度也优于或持平当前的光流估计方法。
其他文献
酷派敞篷新风尚  梅赛德斯 奔驰E-Class Convertible敞篷版    奔驰即将上市新E级敞篷版——2011奔驰E—class convertible,这部新车将在1月的美国底特律国际车展正式亮相。现行版本的梅赛德斯·奔驰CLK跑车自开始销售以来取得相当的成功,但是奔驰公司似乎有意图想要停止CLK跑车的销售,转而采用即将面世的奔驰E—class酷派和敞篷版来取而代之。新款E—class
期刊
结构健康监测(SHM)系统通过部署大量振动传感器,对工程结构动态响应特征(包括固有谐振频率和振动形态等)进行感知,可及时发现结构损伤,成为大型土木工程安全运作的保证。但为了提取结构特征,每个传感器的数据量可能达到数千甚至数万字节。对于能耗受限的无线感知网络而言,无疑将会付出难以承受的传输代价。由此产生一个现实需求:如何在保证结构动态响应特征精度下,大幅降低SHM系统网络中的数据传输开销呢?为解决这一需求,本文提出将压缩感知及其扩展矩阵补全理论应用到系统结构特征计算中。
  压缩感知是一种新兴起的采样
火灾是自然界中经常发生的自然灾害,近年来发生的多次特大火灾给人们一次又一次深刻的教训。随着现代经济的发展,城市规模的扩大,建筑物高度和复杂程度越来越高,建筑的火灾危险系数也随之提高,传统的火灾自动控制系统和消防设施的弊端也愈加明显。近年来科学技术的发展和国家颁布的政策,推动了传统消防向智慧消防的发展,本文即在消防大数据到来的时代背景下,完成了基于大数据驱动的消防远程监控软件系统。
  本文设计实现了一个基于大数据驱动的消防远程监控系统,可以用来监测接入物联网中的各种消防设备的运行状态。系统采用了基于
深度学习目前在大量任务中取得了巨大的成功,这些任务具有大量的用于图像识别、机器翻译和语音合成的标记数据。当标注成本太高或者时间不允许的时候,标注的数据并不是可以大量获得的。相比之下,人类可以在短时间内通过仅仅几个例子就学习到新的概念。少样本学习就是尝试通过训练一个模型来解决此问题,该模型希望可以仅仅基于少量有标签的支持集对一个未标注的样本进行分类。
  本文从特征匹配和多样性迁移两个角度来研究少样本学习任务。论文的主要贡献包括:
  当只有少量带有标注的图像可用于学习一个类别的识别模型时,测试
随着生活水平与科技迅速发展,大气环境污染日益加重,而固定污染源排放的颗粒物是大气污染的重要来源之一。固定污染源指化工厂、火力电厂等位置固定的大气污染物排放源。根据理论与实际调研,固定污染源排放的气溶胶粒径分布特性近似为单峰对数正态分布,需要使用三个波长的设备对气溶胶浓度与粒度谱进行测量。为选择最适合的入射光波长组合,本文基于Mie散射理论,设计实现多通道颗粒物浓度监测系统,为三波长设备关键光学参数的选取提供重要的依据。
  本文基于Mie散射理论设计了优于单通道测量方法的多通道颗粒物浓度监测设备,并
对混合气体成分和状态进行有效快速的传感与监控已在多种不同领域受到人们的重视,而声学传感器拥有高灵敏性、低成本、高实时性等优势,同时由于气体分子的弛豫过程导致了声速频散现象,因此通过分解声速谱能够得到反映气体成分的弛豫特征值,这使得基于声速的气体传感方法成为目前气体传感技术的研究热点之一。
  本文首先根据现有的声弛豫理论分析方法,从混合气体总有效比热容的表达式入手推导并修正了声速及声速频散强度表达式。结合用有限个声速值重建声速谱的算法,证明了气体成分浓度与重建声速谱得到的声速频散强度之间存在定量关系
苹果MacBook是苹果旗下一款针对潮流年轻人所设计的笔记本电脑,它由早期的iBook进化而来,无论是第一款彩色“贝壳机”,还是现如今摆在我们面前的“小白”,在设计上苹果MacBook一直将时尚、自由、简约作为设计出发点。就在今年,苹果MacBook从上一代的银色外观再一次回归到了经典的白色机身,除了外观的改变外,它还吸取了新的技术和新的工艺,使它再一次成为时尚科技的引领者。    时尚定位高端品
期刊
本文致力于探究高维小样本医学影像分析方法。小样本方面,本文提出了基于级联生成对抗网络和半监督学习的多参数医学影像生成方法。并设计生成复杂性度量模型自动确定生成顺序,通过先生成较复杂性较低的模态,再以生成数据作为先验信息辅助复杂性较高的模态数据的生成。本文所提出的多参数医学影像生成模型可以通过半监督学习方式达到端到端地训练。在有监督学习部分,通过约束多模态真实数据对与模拟数据对之间的重建损失,显式地学习多模态数据的联合分布。为缓解过拟合问题,在无监督学习部分通过约束真实数据与模拟数据分布之间的W距离学习不同
物体检测与分割是计算机视觉的基础研究任务,也是很多重要应用的基础,例如:自动驾驶,人脸识别,安防监控。在物体检测与分割中,训练好的模型输出的每一个结果包括物体的类别、定位、以及一个置信度(概率)。该置信度在实际应用是判断物体检测分割结果可靠程度的一个重要依据,准确估计物体检测分割结果的置信度有助于提升相关应用系统的稳健性。然而,目前置信度的估计在物体检测和分割中还存在很多问题,例如,置信度和物体定位准确性不匹配、高度重叠的物体在非最大抑制过程中被部分高置信度的物体抑制,本文则针对这些问题提出相应的解决方法
戴尔studio(思跃)系列是戴尔旗下专攻“多媒体娱乐”的品牌,倡导绝佳影音享受、注重创新设计是studio(思跃)一直以来的品牌宗旨。通过充满设计感的造型和强大的性能,为消费者带来无以伦比的移动影音娱乐体验;其中studio(思跃)13、14、15、17寸笔记本一直是深受消费者欢迎的产品。而此系列的新作——搭载了Intel最新移动版i7处理器的studio 1457笔记本电脑更因强大的性能在未上
期刊