基于深度卷积神经网络的移动机器人视觉地点识别

来源 :国防科技大学 | 被引量 : 5次 | 上传用户:erikwg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉地点识别是移动机器人(如无人车、智能服务机器人等)实现自主视觉导航定位功能的核心基础技术。随着移动机器人长航时自治的需求牵引和高性价比视觉传感器的普及,机器人视觉导航越来越受到重视,视觉地点识别技术研究已成为机器人学和计算机视觉等相关领域中的一个前沿热点。鉴于目前的视觉地点识别方法的稳健性和实时性还远未达到实用化水平,本文主要面向移动机器人自主视觉导航定位应用背景,针对已知环境固定轨迹、已知环境自由轨迹、未知环境自由轨迹三种典型应用场景,在大量公认基准实测地点图像数据集的支持下,以深度卷积神经网络(ConvNet)方法为新技术途径,按照视觉地点识别的典型系统框架,对视觉地点描述、视觉地点记忆与匹配关键技术进行了深入研究,取得了创新性成果,并在此基础上设计并实现了面向以上三种典型应用场景的视觉地点识别原型系统。本文的主要创新性工作如下:在视觉地点描述关键技术研究方面,首先针对固定轨迹巡航的应用场景,提出了一种基于ConvNet全局特征的视觉地点描述算法。该算法将不变性更好的ConvNet特征引入了传统基于全局特征的地点描述算法框架,显著增强了环境条件稳健性,同时极大地提高了计算速率(达到19毫秒/帧)。与基于传统手工特征的先进算法的对比,验证了ConvNet特征在视觉地点描述中更具优势。其次针对自由轨迹巡航的应用场景,评估了基于ConvNet路标特征的视觉地点描述典型算法,发现了不足。为此,对路标检测和ConvNet路标特征提取这两个关键步骤进行了改进,提出了改进的ConvNet路标特征,并在此基础上提出了一种视觉地点描述算法。该算法先采用二值化赋范梯度特征快速检测初始路标,再依据场景语义信息筛选出鉴别力高的路标;同时,设计了一种多层感兴趣区域池化技术,先从多个卷积网络层中快速抽取多分辨率、多级抽象的丰富信息,再进行信息融合,增强了路标特征的独特性。与当前最先进算法的对比,验证了该算法能够更好地兼得算法稳健性和计算实时性(最高可达53毫秒/帧)。在视觉地点记忆与匹配关键技术研究方面,首先针对已知环境的应用场景,提出了一种结合ConvNet路标特征树索引和哈希码的视觉地点记忆与匹配算法。该算法引入了基于树索引的快速最近邻搜索技术,加快了匹配速率;同时,设计了由粗到精匹配策略,有效地缓解了树索引通常会出现的感知混淆问题,保证了匹配准确率。其次针对未知环境的应用场景,提出了一种结合ConvNet路标特征词袋模型(BoCNF)倒排索引和哈希码的视觉地点记忆与匹配算法。该算法借鉴了基于BoW的大规模快速检索技术,建立了BoCNF新模型并创建了BoCNF倒排索引,有效支持了视觉地点记忆中环境地图构建的在线扩展,并确保了当环境地图中所存储的地点个数增加时其计算开销的增长率极低;同时,引入了Hamming Embedding后过滤技术增强了对匹配路标的鉴别能力,采用了由粗到精匹配策略,显著地提高了匹配准确率。公认基准数据集上与当前最先进算法的对比验证了这两种算法的优异性。在视觉地点识别系统设计与实验验证方面,面向三种典型应用场景的需求,在优化组合以上关键技术创新成果的基础上,分别设计并实现了相应的基于ConvNet的视觉地点识别系统。首先,设计并实现了一种面向已知环境固定轨迹应用场景的高稳健性视觉地点识别系统。该系统采用ConvNet全局特征地点描述子,提高了地点识别准确率,而且该描述子仅为单一向量,易于以线性搜索的方式实现实时地点匹配。公认基准数据集下的性能评估验证了该系统的优异性,并在加拿大2015年度机器人野外实测实验中验证了其实用性。其次,设计并实现了一种面向已知环境自由轨迹应用场景的高实时性视觉地点识别系统。该系统采用了本文改进的ConvNet路标特征,增强了地点描述的算法稳健性和实时性;同时借助了树索引和哈希码的由粗到精匹配策略,提高了匹配速率。与当前最先进系统相比,含有20688个地点的环境地图中将地点识别的整体计算效率提高了116倍,达到88毫秒/帧,而地点识别准确度持平。最后,设计并实现了一种面向未知环境自由轨迹应用场景的地域可扩展的视觉地点识别系统。该系统改进了前一系统的视觉地点记忆与匹配步骤,即利用本文改进的ConvNet路标特征建立了词袋模型(BoMCNF),创建了具有实时可扩展性的BoMCNF倒排索引,以此替换树索引。与当前最先进系统相比,在含有4276个地点的环境地图中将地点识别的整体计算速率提高了33倍,达到84毫秒/帧,而地点识别准确度持平。而且,随着环境地图体量的增加,该系统计算开销的增长率极低(如环境地图中所存储的地点个数由853个增加到4276个,而计算开销仅增加2毫秒/帧),可满足大尺度区域实时应用需求。此外,由于BoMCNF倒排索引具有在线可扩展性,该系统具有区域可扩展的特点,能够满足未知环境中同时定位与建图的应用需求。
其他文献
随着社会经济的发展,市场经济竞争日益激烈,企业的竞争已经上升为企业文化之间的竞争。企业文化在企业生存与发展上起着至关重要的作用,关系到企业发展的长远利益,本文从企业
目的:分析不同剂量米非司酮对围绝经期子宫肌瘤诱导绝经的治疗效果。方法:选取笔者所在医院2017年2月-2018年2月收治的对围绝经期子宫肌瘤患者中选取60例,随机分为两组,两组
轨道交通具有运能大、效率高、安全便捷、绿色环保等优势,在满足人民群众出行需求、缓解城市拥堵等方面发挥了重要作用。城市轨道交通客流量大,运营环境相对封闭,一旦发生突
人们的生活质量因科技发展而大幅提高,对产品的要求不但多而且追求个性化的现象也越来越普遍。然而传统的大规模自动化批量产生模式却不能对市场新的需求变化作出快速的响应,
当外资日化大品牌横扫国内日化市场的时候,部分国产日化厂家乱了手脚,盲目跟风不是,创新火候又不够,有种渐入乱花迷人眼的感觉。但更多的本土日化企业在外资品牌的疯狂侵略下,紧紧
简要介绍了基于CAD平台开发悬挂点检查与自动处理的程序开发技术、技术路线、实现方法、主要源代码。主要用于地籍测量数据入库前悬挂点检查,并用实例进行了验证,取得了满意
为推进华北地区高校财税专业人才培养,加强华北各高校在财税专业人才培养和学院综合改革方面的交流,华北高校第九届财政学教学研究会年会暨财税专业人才培养研讨会于2014年4
[目的]观察桂枝乙醇提取物对大鼠离体胸主动脉环的舒张作用及其可能的机制.[方法]采用大鼠离体主动脉环灌流模型,观察桂枝乙醇提取物对苯肾上腺素(1.0μmoL/L)预收缩内皮完整
中国的公司债券市场自2007年发行第一只“07长电债”以来已有10年,公司债券市场规模不断扩大,2007年公司债券发行总额只有112亿元,但是到2016年,公司债券发行总额超过1.5万亿
伴随着我国工厂企业数量的不断增加,我国经济发展速度明显得到提升,与此同时,工厂生产安全问题也愈加受到重视。因为这关系着人们的生命安全,同时对于企业的综合效益也会产生