基于深度学习的深度预测与相机姿态估计研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:zhuifeng188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度预测和相机姿态估计一直以来是计算机视觉领域重要的研究方向之一,是指计算机通过二维图像估计出场景的深度信息和相机姿态信息,广泛应用于自动驾驶、服务型机器人和无人机等人工智能领域。传统基于几何的深度预测方法和相机姿态估计方法虽然在一定程度上能得到场景的深度信息和相机的姿态信息,但是存在计算过程复杂、场景适应性差等问题。目前,基于深度学习的深度预测和相机姿态估计方法一般以卷积神经网络和循环神经网络为基础,通过编解码的方式进行。但是,这些方法都忽略了决定深度最重要的特征之一,也就是运动信息;而且编码模块进行最大池化操作的过程中,很多细节可能会丢失。针对上述问题,本文采用了膨胀卷积与循环神经网络相结合的方法用于深度预测,充分利用运动信息的同时最大限度地保留图像的细节,并对现有的相机姿态估计方法进行了改进。本文的主要研究工作及创新点如下:(1)提出了一种基于PDB-ConvLSTM的深度预测方法。首次将膨胀卷积与ConvLSTM相结合的方法应用于视频的深度预测,膨胀卷积的主要作用是保留图像的细节,而ConvLSTM可以充分利用运动信息。实验结果表明,本文的深度预测方法在有监督预测上精度有所提高,在深度预测准确像素比上比Wang的方法提升了5%,而且无监督预测效果也表现良好。(2)提出了一种基于循环神经网络的相机姿态估计方法。该方法采用卷积层与长短期记忆单元(LSTM)交替结合的网络,其中循环神经网络部分本文采用的是深度双向卷积长短期记忆单元(DB-ConvLSTM),该网络可以学习更深层次的信息,有利于减小姿态估计的误差。实验结果显示,本文的相机姿态估计方法,在有监督估计上平移误差比Wang的方法平均减少了4%,并且其它参数也有较好的表现。本文提出的深度预测方法和相机姿态估计方法在预测精度上都有所提高,并且本文的方法既可用于有监督预测也可用于无监督预测,适用性比较强,对自动驾驶等领域的发展具有一定的意义。
其他文献
学位
移动机器人是人类步进智能化社会的重要产物,集多学科为一体的智能体,随着社会生产力的发展,移动机器人广泛应用到各个领域。一方面,以实现多传感器有效融合来使机器人适用于多种复杂场景,是移动机器人走向智能化的必要前提,另一方面,实现自主导航更是移动机器人自主化完成任务的基础。本课题以移动机器人为实验平台,展开对里程计、IMU和激光雷达不同传感器运动模型,以及点云匹配、地图构建和传感器融合关键技术研究与应
近年来,近视已经成为影响当代儿童身体健康最严重的眼科疾病,我国儿童近视率已经高达百分之四十,随着年龄的增长,比例还在不断的扩大。儿童近视之后不仅会影响日常的学习,如果不加以防治,还有可能导致眼睛出现病理性病变,更严重还会导致永久性失明。目前众多科研人员对于导致儿童近视的原因进行了深入的研究,发现不良用眼习惯是导致儿童后天近视的主要原因,如果能够采用监测设备对于儿童日常学习时的不良姿态做出监测和提醒
学位
学位
学位
依托第五代移动通信网络的应用部署和物联网的快速发展,大量低功耗设备的应用越发广泛,从而使无线携能通信技术越来越受到关注。无线携能通信技术可以利用同一个频段,同时对能量接收机和信息接收机进行能量和信息传输,在保证通信质量的同时解决低功耗设备的能源问题。但是,由于使用的无线频段越来越高,无线信号会因距离或者障碍物等因素限制信号的覆盖范围。另外,在物联网应用中,系统中的信息接收机往往较密集,严重的信号干
移动机器人作为当前科技领域的集大成者,集成了电子信息、计算机科学等多个学科的高精尖技术,其软件系统由感知系统、决策与规划系统、控制系统等多个模块组成,关键技术的重点难点之一就是决策与规划。本文首先介绍了一种结合端到端路径规划技术的自主建图方法,并对其中采用的端到端路径规划算法进行了改进,最后通过仿真实验验证其可行性。针对项目要求的清洁机器人,本文提出一种基于回溯法的双向完全遍历路径规划方法,对工作
现有制造车间的大型设备复杂度高,越来越依赖监控系统对其进行实时性管理。而伴随着车间智能终端设备的迅速增加,目前依靠云计算的设备监控系统所需传输的数据量越来越大,车间需要紧急响应的告警信息容易出现延迟,导致设备不能正常运行,严重会造成设备停机等问题,进而影响车间生产线的生产效率。因此,加入边缘计算模型的云边协同数据处理方式逐渐得到重视。当前基于云计算的智能车间设备监控通常把监控数据全部传输到云端进行
超分辨技术是计算机视觉等领域的重要与热门研究方向,在医疗成像等众多领域有广泛的应用。基于深度学习的超分辨重建技术在近几年中发展迅速,神经网络模型对高分辨图像的重构性能越来越强,充分体现了使用深度学习解决超分辨任务的优势。但基于深度学习的超分辨重建技术在提升系统性能时很多是依靠堆叠大量神经网络和设计各种复杂的网络来实现的。同时训练后得到的部署模型存在推理时间长、参数量多等问题。这导致了设计的许多神经