移动机器人地形分类的视觉方法研究

来源 :中国人民解放军军事医学科学院 | 被引量 : 3次 | 上传用户:FalyE981521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,移动机器人在星际探索、野外搜寻、军事行动和灾害救援等方面均具有重要应用。与室内结构化环境不同,野外场景中,地形-地面的多样性、复杂性会对机器人的移动性能产生较大影响。机器人对其所处地形环境的准确分类是决定其能否实现自主移动的关键性因素。而视觉是最接近人类的环境感知方式,能够提供较为丰富的地形信息,利用视觉方法解决地形分类问题具有重要的理论意义与实用价值。本论文综合运用词袋模型、多层编码向量、深度滤波器等方法,着眼于设计强鉴别力的视觉地形特征,取得了如下创新性成果:(1)完成了模型优化,并在现有框架下设计了混合表达(Hybrid Representation,HR)。词袋模型(Bag of Visual Words,BOVW)缩小底层视觉特征与高层语义之间的语义鸿沟,生成中层语义表达以提高分类效果,逐步成为了地形分类的常用方法和标准范式。我们优化现有BOVW模型,构建了视觉地形分类的最优流程,从而快速、高效地完成视觉地形分类任务。本文首先全面研究和分析了视觉地形分类中的词袋模型方法,系统地总结了现有工作。然后建立了地形数据集Terrain8,评估了词袋模型与特征融合的各种方法。最后根据实验结果,利用特征前处理手段、优化词袋模型、特征融合技术构建了视觉地形分类的最优流程,生成最终的混合表达HR。在Terrain8数据集中完成测试:HR在SIFT和DSIFT条件下分别取得了88.7%和87.7%的分类准确率。同时HR对噪声和光照变化也保持了较强的鲁棒性。(2)运用深度学习网络的构型特点,设计了一种视觉地形分类的新方法——多层编码向量(Hierarchical Coding Vector,HCV)。HCV方法堆叠多层基础BOVW编码层和1层Fisher编码层,构建多层网络结构,将一层的编码结果输入到下一层进行再编码,通过逐层抽象,以获取更丰富的语义信息。BOVW层描述地形图像中的局部图块,Fisher层生成最终的全局表达。HCV通过多个编码层提纯图像语义信息,生成用于描述地形的高层特征,提高了特征的视觉鉴别力。为了更好的对比分类性能,我们使用国际通用数据集21-Class Land Use(LU)和RSSCN7进行评估,实验结果显示了HCV方法的有效性。FV是一种经典的编码方法,联合FV与HCV,我们在LU和RSSCN7数据集上获得了91.8%和86.4%的分类准确率,优于目前文献中的最优结果。随后在Terrain8数据集上也进行测试,方法(HCV+FV)的分类准确率达到了88.0%,与HR的性能相当,具有优秀的视觉地形分类能力。(3)结合多列可叠加的稀疏降噪自动编码器(Stacked Denoising Sparse Autoencoder,SDSAE)和FV池化层,我们提出了一种新型的混合结构——深度滤波器(Deep Filter Banks,DFB)。方法使用多层网络结构,从地形图像中自主学习到具有鉴别力的视觉特征。SDSAE用于描述图像中的局部图块,FV池化层生成鲁棒的全局表达。模型参数是影响分类性能的关键因素,且随着模型扩展,参数寻优空间会呈指数增长,较为复杂的参数整定过程制约分类性能的进一步提升。不同于依靠手工特征的方法,深度滤波器DFB使用机器学习方法完成模型参数的自优化,无需手工整定,模型构建过程变得简单高效。同时DFB能发现图像中更深层的模式结构,具有更出色的视觉地形分类性能。通过实验发现,DFB分别取得了92.7%(LU)、90.4%(RSSCN7)和89.8%(Terrain8)的分类准确率,显示出较为理想的视觉鉴别力,进一步提升了视觉方法的地形分类能力。(4)结合DFB算法生成的视觉特征,设计了地形视频的处理框架,在多种移动机器人平台中进行了应用实验。基于以上的研究成果,我们对算法实用化进行了初步探索。首先设计了地形视频的处理框架,将提出的视觉特征应用于多个移动机器人平台中。视觉地形分类算法运行时,机器人无需停止运动,算法不会干扰机器人的正常任务进展。随后在多种平台上进行实地实验,实验地形包括四种:瓷砖、雪地、沥青和草地。DFB算法在三种移动机器人平台上均取得了较好的视觉分类准确率(四足变胞移动机器人:97.12%、仿生弧腿式移动机器人:99.38%和HUSKY无人地面车:95.92%)。同时,DFB算法还在高速状态、夜光环境中保持了视觉鉴别力,分类准确率分别为94.19%和93.81%。实验结果表明:DFB具有优秀且稳定的视觉地形分类性能,鲁棒性强,具有较好的实用潜力。综上所述,本研究开展了移动机器人地形分类的视觉方法研究,在现有框架下完成了模型优化,设计了二种视觉地形分类的新方法,并基于多种移动机器人平台开展了实地的应用实验。首先建立了地形数据集Terrain8,对BOVW模型和特征融合中的不同方法开展了评估实验,并基于实验数据建立了最优流程。随后借鉴深度学习网络,设计了多层编码向量HCV,方法能生成用于描述地形的高层特征,具有优秀的视觉鉴别力。之后针对HCV模型较为复杂的参数整定过程,结合SDASE和FV方法,设计了深度滤波器DFB,模型可完成参数自整定,构建变得更加简单高效,特征的视觉鉴别力获得进一步提升。最后在三种移动机器人平台和四种地形中完成了算法的实地应用实验,验证了视觉地形分类效果。论文研究成果可为移动机器人在复杂未知地形上的运动控制和自主导航提供重要的信息参考。
其他文献
镁阳极材料的电化学性能和耐腐蚀性能主要取决于添加的合金元素和材料的微观组织。针对镁阳极材料普遍存在的溶解不均匀、电流效率低下等问题,选择高活性的合金元素,研究其对
发韧于20世纪50-70年代的"关键词批评"以核心术语为考察重心,从历时和共时层面梳理并揭示出词语背后的政治思想倾向与人文踪迹,具有独到的研究视角和开阔的理论视野。雷蒙·
目的探讨新生儿疾病筛查中心新生儿先天性甲状腺功能低下促甲状腺激素(TSH)初筛和确诊阳性结果的符合率。方法用时间分辨荧光分析法(DELFIA)初筛测定干血片TSH值阳性结果的患
在pH=9.34的碱性溶液介质中,氨曲南(ATN)与维多利亚蓝B(VIB)反应生成蓝色离子缔合物,使共振光散射(RLS)显著增强并产新的RLS光谱,在最大散射峰370nm处,ATN的质量浓度在0.003~
目的探讨Sandwich教学法在外科护理学课程中的应用效果。方法随机选取本院护理专业两个班级分为对照组和观察组,每组36名学生。对照组采取传统授课方式教学,观察组采取Sandwi
目的探讨分析将正性暗示语及细节护理干预应用于手术室护理工作中的效果和临床意义。方法将我院126例手术患者分为观察组和对照组,每组63例,对照组采用手术室常规护理模式,观
三资问题是受到了广大农村居民及相关政府部门的普遍重视,所谓的三资问题就是指对农村集体的资金、资产及资源的管理问题。但是对于当前有些村来说,因为存在很多的制度及运作
近年来随着证券市场的飞速发展,证券业正面临经营模式的改变,电子技术的进步和投资者交易习惯的改变强烈冲击着行业传统。电话委托和查询、图文版远程委托和查询、网上交易以
兵团舞蹈是民族文化整体中的一个组成部分。它的多元舞蹈文化特征——"军旅舞蹈"、"屯垦舞蹈"、"丝路舞蹈"、"民俗舞蹈"、"中原舞蹈"、"江海舞蹈"等,是由兵团历史发展而来。其特有的社会