论文部分内容阅读
目前,移动机器人在星际探索、野外搜寻、军事行动和灾害救援等方面均具有重要应用。与室内结构化环境不同,野外场景中,地形-地面的多样性、复杂性会对机器人的移动性能产生较大影响。机器人对其所处地形环境的准确分类是决定其能否实现自主移动的关键性因素。而视觉是最接近人类的环境感知方式,能够提供较为丰富的地形信息,利用视觉方法解决地形分类问题具有重要的理论意义与实用价值。本论文综合运用词袋模型、多层编码向量、深度滤波器等方法,着眼于设计强鉴别力的视觉地形特征,取得了如下创新性成果:(1)完成了模型优化,并在现有框架下设计了混合表达(Hybrid Representation,HR)。词袋模型(Bag of Visual Words,BOVW)缩小底层视觉特征与高层语义之间的语义鸿沟,生成中层语义表达以提高分类效果,逐步成为了地形分类的常用方法和标准范式。我们优化现有BOVW模型,构建了视觉地形分类的最优流程,从而快速、高效地完成视觉地形分类任务。本文首先全面研究和分析了视觉地形分类中的词袋模型方法,系统地总结了现有工作。然后建立了地形数据集Terrain8,评估了词袋模型与特征融合的各种方法。最后根据实验结果,利用特征前处理手段、优化词袋模型、特征融合技术构建了视觉地形分类的最优流程,生成最终的混合表达HR。在Terrain8数据集中完成测试:HR在SIFT和DSIFT条件下分别取得了88.7%和87.7%的分类准确率。同时HR对噪声和光照变化也保持了较强的鲁棒性。(2)运用深度学习网络的构型特点,设计了一种视觉地形分类的新方法——多层编码向量(Hierarchical Coding Vector,HCV)。HCV方法堆叠多层基础BOVW编码层和1层Fisher编码层,构建多层网络结构,将一层的编码结果输入到下一层进行再编码,通过逐层抽象,以获取更丰富的语义信息。BOVW层描述地形图像中的局部图块,Fisher层生成最终的全局表达。HCV通过多个编码层提纯图像语义信息,生成用于描述地形的高层特征,提高了特征的视觉鉴别力。为了更好的对比分类性能,我们使用国际通用数据集21-Class Land Use(LU)和RSSCN7进行评估,实验结果显示了HCV方法的有效性。FV是一种经典的编码方法,联合FV与HCV,我们在LU和RSSCN7数据集上获得了91.8%和86.4%的分类准确率,优于目前文献中的最优结果。随后在Terrain8数据集上也进行测试,方法(HCV+FV)的分类准确率达到了88.0%,与HR的性能相当,具有优秀的视觉地形分类能力。(3)结合多列可叠加的稀疏降噪自动编码器(Stacked Denoising Sparse Autoencoder,SDSAE)和FV池化层,我们提出了一种新型的混合结构——深度滤波器(Deep Filter Banks,DFB)。方法使用多层网络结构,从地形图像中自主学习到具有鉴别力的视觉特征。SDSAE用于描述图像中的局部图块,FV池化层生成鲁棒的全局表达。模型参数是影响分类性能的关键因素,且随着模型扩展,参数寻优空间会呈指数增长,较为复杂的参数整定过程制约分类性能的进一步提升。不同于依靠手工特征的方法,深度滤波器DFB使用机器学习方法完成模型参数的自优化,无需手工整定,模型构建过程变得简单高效。同时DFB能发现图像中更深层的模式结构,具有更出色的视觉地形分类性能。通过实验发现,DFB分别取得了92.7%(LU)、90.4%(RSSCN7)和89.8%(Terrain8)的分类准确率,显示出较为理想的视觉鉴别力,进一步提升了视觉方法的地形分类能力。(4)结合DFB算法生成的视觉特征,设计了地形视频的处理框架,在多种移动机器人平台中进行了应用实验。基于以上的研究成果,我们对算法实用化进行了初步探索。首先设计了地形视频的处理框架,将提出的视觉特征应用于多个移动机器人平台中。视觉地形分类算法运行时,机器人无需停止运动,算法不会干扰机器人的正常任务进展。随后在多种平台上进行实地实验,实验地形包括四种:瓷砖、雪地、沥青和草地。DFB算法在三种移动机器人平台上均取得了较好的视觉分类准确率(四足变胞移动机器人:97.12%、仿生弧腿式移动机器人:99.38%和HUSKY无人地面车:95.92%)。同时,DFB算法还在高速状态、夜光环境中保持了视觉鉴别力,分类准确率分别为94.19%和93.81%。实验结果表明:DFB具有优秀且稳定的视觉地形分类性能,鲁棒性强,具有较好的实用潜力。综上所述,本研究开展了移动机器人地形分类的视觉方法研究,在现有框架下完成了模型优化,设计了二种视觉地形分类的新方法,并基于多种移动机器人平台开展了实地的应用实验。首先建立了地形数据集Terrain8,对BOVW模型和特征融合中的不同方法开展了评估实验,并基于实验数据建立了最优流程。随后借鉴深度学习网络,设计了多层编码向量HCV,方法能生成用于描述地形的高层特征,具有优秀的视觉鉴别力。之后针对HCV模型较为复杂的参数整定过程,结合SDASE和FV方法,设计了深度滤波器DFB,模型可完成参数自整定,构建变得更加简单高效,特征的视觉鉴别力获得进一步提升。最后在三种移动机器人平台和四种地形中完成了算法的实地应用实验,验证了视觉地形分类效果。论文研究成果可为移动机器人在复杂未知地形上的运动控制和自主导航提供重要的信息参考。