论文部分内容阅读
当前,移动机器人已经被广泛应用到了工业、航天、军事、服务等诸多领域。随着应用领域的拓展,人们对移动机器人的智能性要求也越来越高。由于视觉系统是最接近人类感知环境的方式,且能够为移动机器人提供丰富的感知信息,因此,基于视觉的环境感知问题成为智能机器人领域的研究热点,吸引了大量的研究人员参与。物体识别是移动机器人环境感知与导航定位的基础和核心,研究此类问题对提高机器人智能化水平的具有重要的科学意义和实际应用价值。在真实的动态复杂环境下,机器人视觉所拍摄的图像不可避免地存在视角、光照、尺度等变化,给研究物体识别问题带来极大挑战。本文针对移动机器人感知实际环境所面临的上述问题,研究基于BOW和PLSA模型的物体识别,主要内容包括: (1)研究了基于尺度不变特征和词袋模型的物体识别方法。特征提取是物体图像识别过程中的一个关键步骤,其提取结果的好坏对识别结果起到至关重要的作用。图像局部特征因其包含了人类感兴趣的重要目标,最能表达图像的内容,受到越来越多的研究人员所关注。本文在分析比较几种常用的特征描述子的基础上,考虑到虽然SIFT特征对光照变化、视角变化和缩放等具有不变性,在物体识别中能够获得较好的匹配效果,但同时也存在识别时间较长的问题,因此,研究了基于SIFT局部特征和词袋模型的(Bag of Words,BOW)物体识别方法:采用BOW模型重构图像特征,将图像的局部特征矢量量化成视觉单词,根据图像视觉单词出现的频率完成物体图像识别。实验结果表明,该方法能够保持SIFT局部特征在物体识别中所具有的优势的同时,大大减少了物体识别的时间,更好地满足移动机器人视觉导航的实际应用需求。 (2)提出一种改进的词袋模型(IBOW)物体识别方法。传统的BOW模型虽然满足了实时性的要求,但是识别率会有所降低。为了更好地实时处理具有复杂的非线性变化的图像,并能满足机器人对实时性的要求,在传统BOW模型的基础上,引入词频.逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)权重计算方法,计算视觉单词在特征集合的权重,根据权重大小保留具有较强区分能力视觉单词。分别在不同的数据集上进行了实验,结果表明:与传统的BOW模型相比,IBOW模型的物体识别方法在保证实时性的同时,具有更高的识别率。 (3)提出了一种改进的概率潜在语义分析(IPLSA)物体识别方法。传统的分类模型虽然对在不同时间、地点下的同一个物体有较高的识别结果,但是对每个个体都存在外观、形状差异的同类物体,仅凭借图像的底层特征信息,而不考虑跨越语义鸿沟的方法显然具有较大的局限性。为了缩小语义鸿沟以及应对复杂图像识别问题,本文借鉴文本信息检索领域中概率潜在语义分析方法(Probabilistic latent semantic analysis,PLSA),通过对图像进行语义建模,计算每幅图像的潜在主题,来达到对同类物体图像识别的目的。实验表明:针对同类物体的识别,PLSA方法相比传统的分类模型具有优越性,但是由于传统的PLSA方法只计算视觉单词之问的语义信息,却忽略了视觉单词的空间信息,其识别效果仍不能满足移动机器人实际应用。针对此问题,本文提出一种改进的概率潜在语义分析模型(Improved-PLSA):考虑到视觉单词之间的空问信息,通过建立起局部描述子到某种局部语义概念的映射,再利用图像中局部语义概念的分布来实现图像的分类识别。实验证明:改进的概率潜在语义分析(IPLSA)模型比传统的PLSA模型具有更高的正确识别率,而且整个训练模型的过程都是离线完成,因此,所提出的方法可以应用于移动机器人的视觉任务。 (4)在以上算法研究的基础上,利用OpenCV和C/C++技术构建了一套基于局部显著特征的物体识别软件原型系统。该系统具有特征提取与分析,物体识别等功能,同时具有较好的可视化效果。软件测试结果表明,所构建的系统原型具有较好的鲁棒性。