基于深度学习的单目视觉立体场景构建的研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户：huanyingchangmaoshou

【摘要】

：

【作者】

：

陈昀

【机构】

：

电子科技大学

【出处】

：

电子科技大学

【发表日期】

：

2021年01期

【关键词】

：

同步定位与地图构建深度估计语义地图语义分割

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

同步定位与建图（Simultaneous Localization And Mapping,SLAM）已经在机器人视觉领域进行了几十年的研究,但是基于传统建图方法下的深度估计花费时间长,很难达到工程上要求的实时性,而且地图中不具包含义信息,使得三维建模在应用方面的拓展受阻。基于这些问题本文设计了一种基于深度学习的单目图象深度估计的方法,提高建图速度,同时设计了一种融合的语义分割网络,让整个系统能够快速构建出场景三维模型的同时还能包含语义信息。以下是本文的主要研究与贡献。1.为了解决传方法中深度估计花费时间长导致的实时性问题,本文设计一种基于编解码结构改进的图像深度估计算法。该算法的编码器采用的是结构简单的Densenet-169网络编码器,网络中只包含4个主要模块。网络中当前卷积层的输入来自前面所有层的输出,然后通过卷积降维,这样就减小了传递过程中的数据冗余还有梯度损失,所以能够快速、准确的估计图像深度。为了减小网络的GPU内存消耗,通过动态调整的方式重新构造网络中的消耗成本体实现粗略到精细的深度估计,同时用Inplace-ABN模块来替换卷积中原来的BN+激活函数模块,前向传递时只需要存储少量数据,其他数据在反向传播中计算出来,这样就只要增加少量的计算量从而节约大量的GPU内存消耗,同时还不降低网络精度。2.为了解决构建好的地图中不包含语义信息限制了地图的应用拓展问题,本文设计了一种融合深度图与RGB图片的语义分割网络,并将语义分割结果映射在构建好的地图中。依据深度图特征主要分布在目标结构边缘,RGB图片特征主要分布在目标表面的不同,提取两者图片特征并通过concat+1×1卷积的方式进行特征多级融合,使得最终的融合特征图能够具备两种图像的特征。再结合空间金字塔池化结构提取不同感受野下的融合特征图的特征,利用低层次的局部信息对高层次的整体信息进行弥补,最后利用注意力辅助机制,来使得改进后的网络提取特征点的时候更加专注于两者特征融合的部位,从而达到提高语义分割的效果,进而使重建的三维语义地图有更广泛的应用。3.将各个模块组合搭建出一个三维语义重建系统。将本文设计的算法在主流数据集上测试算法结果,然后与其他先进算法做了对比试验。实验表明本文提出的算法相比较于传统的算法有了一定的提升,实时性与准确性满足工程要求。

其他文献

自适应步态身份识别中的深度迁移学习的研究

人体步态,作为一个新兴的生物识别特征,可以利用图像传感器以及惯性传感器采集在一段时间内行走过程中的步态信息（如一系列视频帧或加速度、角速度等）,进行身份识别。与目前日常生活中被广泛应用的生物特征相比,生物步态特征具有能够远程捕获以及不易模仿等优点,可以通过非接触式的方法获取到被测者的步态信息,进而完成身份信息的判别。本文首先制作数据集,利用自主编写的Android平台APP依次采集被测者完成指定动

学位

步态识别神经网络深度迁移方向无关性动态环境

基于网络压缩的深度模型优化关键技术研究及原型实现

近年来,深度卷积神经网络（CNNs）在计算机视觉领域表现出色,同时计算机视觉等人工智能系统工程应用的需求也日益增长,对于神经网络压缩与加速的方法研究也日趋活跃。但是由于其过参数化的设计,卷积神经网络导致了网络模型巨大的参数量和昂贵的计算消耗,使得将模型部署到一些资源受限的设备的上变得非常困难,如嵌入式设备、移动手机等。如何在资源受限的设备上部署高可用、高可靠的网络模型,这成为了人工智能在现实生活中

学位

卷积神经网络网络压缩与加速滤波器剪枝模型容纳能力模型部署

基于无人系统集群的多维数据态势感知技术研究

随着信息与科学技术的繁荣发展,未来现代电子信息作战具有装备信息化程度高、交战过程实时变化性强、战场信息不确定性强、博弈强对抗等特征。指挥员针对敌方战场信息的认知提出了更高的要求,但传统的方法过于依赖专家提取特征,人为提出特征间的关系会带来主观性过强、经验依赖性过高以及实时性较差等问题。贝叶斯网络作为基于图论与概率统计的图模型,以数据学习为核心,避免了人为主观性过强等问题从而在许多领域发挥重要的作用

学位

态势感知动态贝叶斯网络结构学习分布式系统

基于主动学习少标签样本的卷积神经网络研究

随着科技的发展与工程需要的多元化,计算技术在图像识别领域中的应用越来越广泛。其中卷积神经网络具有优秀的图像识别效果,相比于常规图像识别算法,它具有更为有效的特征提取结构以及识别结构,已成为图像识别领域中主要技术之一。众所周知,图像样本的质量、数量是影响图像识别的关键因素,但是在一些重要专业领域,如遥感、雷达、医疗等,不仅面临获取大量、高质量的图像数据存在困难,更面临对这些专业图像标注的专业人力不足

学位

分组式主动学习卷积神经网络微调GoogleNet遥感图像识别

空间众包任务分配方法研究与应用

众包是一种分布式的计算范式,它可以整合社会中的群体智慧来完成一些计算机或非专业人员无法完成的复杂任务。共享经济社会的形成,推动了一种基于位置的众包服务应用——空间众包的出现和发展。它在便利生活、智能交通等生活领域贡献了巨大价值。空间众包中基本且核心的研究方向包括任务分配和用户隐私保护,但以往的研究大多仅关注众包任务和工人,而忽略了需要不同专业领域知识的多技能任务分配。其次,由于空间众包是基于位置的

学位

空间众包任务分配多技能差分隐私

基于移动端网络流量的用户行为识别模型研究

近年来,移动智能设备（如智能手机和平板电脑）在商业上取得了越来越大成功,已经成为全球数十亿人日常生活中不可或缺的元素。移动设备不仅用于传统的通信活动,如语音通话和信息通信,还用于大量的多用途应用,如金融、游戏、视频会议和购物等。移动用户日常上网行为不仅带来了流量的爆炸式增长,同时也使用户行为呈现出复杂性和多样性。因此,深入分析移动应用流量,识别用户异常行为对移动互联网的安全防范具有重要意义。本文的

学位

用户行为识别深度学习迁移学习孪生神经网络

基于网络数据包的未知协议包结构研究与应用

随着网络环境日益复杂,越来越多网络协议开发者选择构建私有协议来进行数据的发送和接收,以满足其个性化需求。但是也有许多恶意应用程序利用私有协议来进行网络数据的传输,大大降低被破解的可能性,同时让此类非法活动变得更加隐秘,给网络安全带来巨大威胁。因此,对这些未知协议进行分析和处理,是网络安全领域亟需解决的问题之一。采用传统的从软件层面逆向分析二进制代码的方式不仅实现复杂、可移植性低、无法分析加密程序,

学位

网络流量MT-BIRCH序列对比协议格式验证

六足机器人运动控制仿真

在人类探索世界的过程中,存在着许多无法到达的场所,而足式机器人由于其承载能力强、稳定性好、适应各种不同地形而成为研究重点,六足机器人由于其相对四足机器人可以实现更好的稳定性,而与八足机器人相比,六足机器人机体结构又更为简单,因此有更简单的运动控制策略,因而有其重要应用。本文设计构建了六足机器人模型,从足尖轨迹规划、中枢模式发生器、深度强化学习三种运动控制方法对机器人运动控制策略进行了研究与仿真。本

学位

六足机器人轨迹规划中枢模式发生器深度强化学习

面向智能车的嵌入式动力控制系统设计

新能源汽车代表着汽车电动化与智能化的发展走向。四轮轮毂电机独立驱动的汽车方案有着简洁的传动机构和更高的可控自由度,其动力系统一直是研究的热点。本文以四轮轮毂电机独立驱动的电动汽车为研究对象,对整车动力系统方案、动力系统域控制器平台设计展开研究。主要研究内容如下:（1）针对电动汽车建立动力系统仿真计算模型,用于分析其动力性能指标,主要包括分析该汽车动力驱动系统对驱动力矩、电机转速、动力驱动总功率等需

学位

四轮独立驱动RTOS动力控制系统软件分层架构

基于深度学习的虚拟网络映射技术

近几年各类新兴技术例如量子科技、区块链以及人工智能迅猛发展,给传统网络带来了极大的挑战,而网络虚拟化技术为传统网络能满足多元化的网络需求带来了可能性。本文主要从以下两个方面对虚拟网络映射问题进行研究:针对深度卷积神经网络的计算负载会使终端设备产生大量能耗的问题,本文将深度卷积神经网络的计算任务作为虚拟网络请求,将它映射到多个终端设备上,由多台终端共同分担计算来减少对自身的损耗。在实现时将神经网络每

学位

虚拟网络映射深度强化学习离散粒子群算法Nature深度Q网络

基于深度学习的单目视觉立体场景构建的研究

其他学术论文