动态环境下基于语义信息的视觉SLAM算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:daodaotianxia1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
同时定位与建图(Simultaneous Localization and Mapping,SLAM)是移动机器人领域的关键技术之一。已经成熟的视觉SLAM算法大多假设场景是静态的,当场景中存在运动物体时会干扰特征匹配,进而对SLAM系统的定位以及建图的精度造成较大影响。所以在动态环境下,SLAM算法需要识别出场景中的运动物体。本文设计视觉SLAM算法,提升算法在动态环境下的定位精度,并生成动态环境的语义地图。本文的主要研究内容包括:(1)介绍了课题的研究背景与意义,并简单总结了SLAM的发展历史与视觉SLAM的研究现状。接下来介绍了经典视觉SLAM框架、相机位姿估计流程和地图构建。(2)分析了运动物体对相机位姿估计的影响,结合语义信息设计了基于对象位置关系图的视觉里程计算法和基于语义特征点的视觉里程计算法。在基于对象位置关系图的视觉里程计算法中,首先使用Mask R-CNN网络对原始图像进行实例级分割,然后根据深度图和语义信息计算对象的位置关系图,最后结合先验知识数据库判断物体的运动状态。最终排除运动物体上提取的特征点。在基于语义特征点的视觉里程计算法中,同样使用Mask R-CNN对原始图像进行语义分割。在特征点提取阶段首先使用语义信息和稀疏光流检测运动物体,最终排除运动物体上提取的特征点。在特征点匹配阶段,结合语义信息提出了语义特征点匹配算法。将本文提出的视觉里程计算法与ORB-SLAM3和其他动态场景SLAM系统进行了比较。实验结果表明,在高度复杂度的动态环境下,我们的方法大大提高了相机的定位精度和系统的鲁棒性。(3)最后使用上述的视觉里程计算法输出的关键帧位姿结合深度图和语义信息构建语义地图。针对在动态环境中运动物体会对建图造成干扰,设计了运动物体去除算法。此外在稠密点云图的构建上,为了提高点云构建精度,设计了基于快速导向滤波的深度图修复算法。实验结果表明,本文的语义地图构建算法具有较好的鲁棒性和建图精度。
其他文献
近年来,深度学习方法在计算机视觉领域取得了卓越的进展。然而,这些成就大都依赖于大量的标注样本,当训练样本不足时,深度学习很难发挥作用。为了解决深度模型在小样本情况下的学习问题,小样本学习被提出,旨在通过很少量的标注样本来学习到一个优秀的分类器。由于这一特性,小样本学习逐渐成为视觉识别中的一个受关注的领域。小样本学习的基本思想是从大规模数据集上学习可迁移的知识,并通过这些知识来帮助模型快速地学习到目
交通事故对道路交通安全造成了极大的威胁与挑战,分析事故成因模式对于减少事故发生数量,降低事故所造成的损失起到了积极作用。由于道路交通系统固有的复杂性,常见的自动化算法会显得不够灵活。可视分析通过交互的方式将领域专家的专业知识引入分析流程中,通过将机器智能与人类智能相结合的方式,提高了分析结果质量和效率。因此本文提出将道路交通专家的领域知识与机器智能通过可视分析方法结合至一起,迭代式优化分析结果的方
水下无线传感器网络作为一种探索和开发海洋的新方法,在人类不易接触的水下区域的探测和监测中发挥着重要作用。水下无线传感器网络已广泛用于海洋信息收集,地质灾害预防,资源勘探和军事监测等许多领域,是无线传感器网络领域研究的热点之一。在水下空间中传感器节点如何自主调整位置实现对目标事件的覆盖和监视是一个重要课题,它为网络拓扑、目标监测、数据路由等应用领域提供支持,是决定水下无线传感器网络服务质量和工作效能
图像分割是图像处理领域和计算机视觉领域中的关键技术之一。活动轮廓模型分割法因在医学图像等复杂图像的分割中取得了较好的分割效果而被广泛应用。医学图像大多为灰度不均的且含噪声的图像,基于区域的局部二值拟合活动轮廓模型有效解决了该类型图像的分割问题,但该模型中存在水平集函数演化效率低、分割效果易受噪声影响以及初始轮廓敏感等问题。本文针对以上问题进行改进并做出仿真,具体工作如下:1.针对模型分割效率低和易
目标检测是计算机视觉领域里一项十分重要的任务,在交通、医疗、国防等领域有广泛的应用。深度学习的引入使得目标检测算法获得了巨大的进步,目前基于深度学习的目标检测算法在精确度与速度上已经大幅超越传统算法,成为本领域的主流。本文针对目标检测算法所存在的一些困难,在经典的一阶段目标检测算法SSD的基础之上,进行了一系列的研究工作。本文的主要内容如下:目标检测任务是一种多尺度的任务,使用来自网络中不同深度的
由于时代的进步,遥感领域的科研技术也逐渐成熟,人类通过各类遥感卫星获取大量影像数据变得轻而易举。其中合成孔径雷达(Synthetic Aperture Radar,SAR)和可见光影像应用领域非常之广,尽管两者间灰度值区别很大,可它们均有自身的特性。可见光影像成像机理为光反射成像,依赖光源,所以该影像具备大量的光谱信息与细节信息,直观效果很好。SAR影像的成像机理为主动微波式成像,对桥梁、房屋等建
目标检测能够快速地从图片或视频中捕捉到感兴趣的目标,并输出目标的种类和目标的位置。作为计算机视觉的重要分支,它是人脸识别、目标跟踪等算法的基础性算法,一直是计算机视觉领域研究的热点。随着目标检测的技术的成熟,它的应用已经普及到生产和生活的许多领域,如交通、医疗、安防等领域。现如今,得益于GPU计算能力不断的提升和深度学习的快速发展,深度学习方法的优越性在许多领域得到体现。计算机视觉领域因深度学习的
高光谱图像包含大量的光谱波段,它是一种同时结合光谱信息和空间信息的三维图像数据。在现实生活中,高光谱图像可以应用到许多领域。例如:在农产品的检测中有助于种类识别;对地表建筑物的分类有助于城市管理;对病理图像的识别可用于疾病监控;对军事地图的分类能应用于国防建设。因此提出新颖高效的高光谱图像分类方法能够在众多领域中发挥重要的作用。为了提升高光谱图像分类的精确性,需要解决其高维度和样本少的困难。而深度
随着自然语言处理技术的不断发展,人们开始利用神经网络搭建人和机器之间的沟通桥梁—情感分析。已有的方法已经无法满足精细化分类的需求,研究者们开始追求细粒度更高的方面级情感分析技术,但是分析结果的准确度和时间成本一直以来都差强人意。本文针对方面级情感分析存在的一系列问题展开相关研究,本文的主要工作内容如下:(1)本文提出一种基于层次神经网络的方面级情感分析模型,利用双向LSTM对文本信息进行处理,同时
同时定位与建图(Simultaneous Localization and Mapping,SLAM)指的是机器人在未知环境中利用自身搭载的传感器,在运动过程中通过观察到的环境信息对自身位置和姿态进行定位,并同时构建周围环境的地图。SLAM在自动驾驶、避障导航、服务机器人等方面有着广泛的应用,是智能机器人应用的核心关键技术。目前视觉SLAM研究多数假定环境是静态的,使得SLAM算法无法处理复杂多变