论文部分内容阅读
随着人工智能的飞速发展,机器人同时定位与建图(SLAM)作为智能机器人领域的一个重要研究方向也得到了越来越多的关注。机器人同时定位与建图是机器人应用的核心技术,涉及领域广泛,从智能家居机器人到自动驾驶技术,从增强现实、混合现实到虚拟现实技术。目前,传统的视觉SLAM技术已经无法满足机器人应用的需求了,具备场景理解的语义SLAM是SLAM技术未来的发展方向之一。传统的视觉SLAM在纹理重复或无纹理的环境中容易失效,并且对于场景中的动态物体容忍度不高,常会因为动态物体的出现导致跟踪失败。本文提出了一种新的语义视觉SLAM解决方案,相较于传统的视觉SLAM系统,对动态物体的鲁棒性更高,并且能构建出物体级别的语义地图,更容易扩展到其他机器人应用中。物体关联问题是引入语义信息到传统SLAM中必然出现的问题。正确的物体关联是实现成功的对象SLAM系统的关键因素,因为物体关联和SLAM是内在耦合的。课题利用深度学习模型将物体检测和物体姿态估计结合到基于特征点的视觉SLAM中,语义信息为SLAM运动估计提供约束,SLAM位姿估计促进物体关联,两者相互促进。本文的主要工作和成果如下:1.针对物体关联问题,提出了一种基于层次狄利克雷过程(HDP)的物体关联新的表达方式。通过HDP,环境被分层划分为单独的子空间,并且仅将同一子空间中的物体关联。这样可以提高物体关联的准确性和计算效率。得益于新的表示形式,本文的物体关联方法还能够纠正错误的物体关联。2.将对象位姿引入后端优化处理中。以紧耦合的方式处理了物体关联和位姿优化问题,使得这两个方面可以相互促进。在室内和室外数据集上对所提出的方法进行了评估,实验结果表明,相对于传统视觉SLAM而言,本文提出的方法的运动估计精度有15%-19%的提高,并且语义信息的加入使系统的鲁棒性也得到大幅提高。3.实现一个完整的语义SLAM系统。将物体语义信息获取模块、基于主题模型的物体关联算法和语义信息约束优化结合到ORB-SLAM开源框架中,本文的语义视觉SLAM系统能够实时估计相机位姿,重建稀疏的语义地图。