基于BOW和PLSA模型的物体识别方法

来源 :北京工业大学 | 被引量 : 0次 | 上传用户：wreck2

【摘要】

：

当前,移动机器人已经被广泛应用到了工业、航天、军事、服务等诸多领域。随着应用领域的拓展,人们对移动机器人的智能性要求也越来越高。由于视觉系统是最接近人类感知环境的

【作者】

：

王锴

【机构】

：

北京工业大学

【出处】

：

北京工业大学

【发表日期】

：

2012年期

【关键词】

：

移动机器人 PLSA模型物体识别 BOW模型特征描述子视觉单词

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

当前,移动机器人已经被广泛应用到了工业、航天、军事、服务等诸多领域。随着应用领域的拓展,人们对移动机器人的智能性要求也越来越高。由于视觉系统是最接近人类感知环境的方式,且能够为移动机器人提供丰富的感知信息,因此,基于视觉的环境感知问题成为智能机器人领域的研究热点,吸引了大量的研究人员参与。物体识别是移动机器人环境感知与导航定位的基础和核心,研究此类问题对提高机器人智能化水平的具有重要的科学意义和实际应用价值。在真实的动态复杂环境下,机器人视觉所拍摄的图像不可避免地存在视角、光照、尺度等变化,给研究物体识别问题带来极大挑战。本文针对移动机器人感知实际环境所面临的上述问题,研究基于BOW和PLSA模型的物体识别,主要内容包括:　　(1)研究了基于尺度不变特征和词袋模型的物体识别方法。特征提取是物体图像识别过程中的一个关键步骤,其提取结果的好坏对识别结果起到至关重要的作用。图像局部特征因其包含了人类感兴趣的重要目标,最能表达图像的内容,受到越来越多的研究人员所关注。本文在分析比较几种常用的特征描述子的基础上,考虑到虽然SIFT特征对光照变化、视角变化和缩放等具有不变性,在物体识别中能够获得较好的匹配效果,但同时也存在识别时间较长的问题,因此,研究了基于SIFT局部特征和词袋模型的(Bag of Words,BOW)物体识别方法:采用BOW模型重构图像特征,将图像的局部特征矢量量化成视觉单词,根据图像视觉单词出现的频率完成物体图像识别。实验结果表明,该方法能够保持SIFT局部特征在物体识别中所具有的优势的同时,大大减少了物体识别的时间,更好地满足移动机器人视觉导航的实际应用需求。　　(2)提出一种改进的词袋模型(IBOW)物体识别方法。传统的BOW模型虽然满足了实时性的要求,但是识别率会有所降低。为了更好地实时处理具有复杂的非线性变化的图像,并能满足机器人对实时性的要求,在传统BOW模型的基础上,引入词频.逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)权重计算方法,计算视觉单词在特征集合的权重,根据权重大小保留具有较强区分能力视觉单词。分别在不同的数据集上进行了实验,结果表明:与传统的BOW模型相比,IBOW模型的物体识别方法在保证实时性的同时,具有更高的识别率。　　(3)提出了一种改进的概率潜在语义分析(IPLSA)物体识别方法。传统的分类模型虽然对在不同时间、地点下的同一个物体有较高的识别结果,但是对每个个体都存在外观、形状差异的同类物体,仅凭借图像的底层特征信息,而不考虑跨越语义鸿沟的方法显然具有较大的局限性。为了缩小语义鸿沟以及应对复杂图像识别问题,本文借鉴文本信息检索领域中概率潜在语义分析方法(Probabilistic latent semantic analysis,PLSA),通过对图像进行语义建模,计算每幅图像的潜在主题,来达到对同类物体图像识别的目的。实验表明:针对同类物体的识别,PLSA方法相比传统的分类模型具有优越性,但是由于传统的PLSA方法只计算视觉单词之问的语义信息,却忽略了视觉单词的空间信息,其识别效果仍不能满足移动机器人实际应用。针对此问题,本文提出一种改进的概率潜在语义分析模型(Improved-PLSA):考虑到视觉单词之间的空问信息,通过建立起局部描述子到某种局部语义概念的映射,再利用图像中局部语义概念的分布来实现图像的分类识别。实验证明:改进的概率潜在语义分析(IPLSA)模型比传统的PLSA模型具有更高的正确识别率,而且整个训练模型的过程都是离线完成,因此,所提出的方法可以应用于移动机器人的视觉任务。　　(4)在以上算法研究的基础上,利用OpenCV和C/C++技术构建了一套基于局部显著特征的物体识别软件原型系统。该系统具有特征提取与分析,物体识别等功能,同时具有较好的可视化效果。软件测试结果表明,所构建的系统原型具有较好的鲁棒性。

其他文献

基于贝叶斯网络的肿瘤基因表达谱分析

基因芯片，又称DNA芯片或DNA微阵列，它们是DNA杂交探针技术与半导体工业技术相结合的结晶，并伴随着“人类基因组计划”而发展起来的一门新兴技术，具有高通量、大规模、平行性等特

学位

肿瘤基因表达谱特征提取贝叶斯网络遗传算法支持向量机

基于视觉和惯性传感器的移动机器人自定位研究

本文在北京市自然科学基金项目“基于惯性和视觉传感器的移动机器人位姿估计(4082032)”的支持下,以中国科学院自动化研究所的智能轮式移动机器人AIM为实施平台,进行移动机器

学位

角点提取匹配算法信息融合自定位移动机器人位姿变换

基于产生式规则的代码生成系统研究与实现

随着社会进步和网络技术的不断发展，web应用系统在信息化建设中得到广泛应用。构建在J2EE平台上的各种框架与技术，促进了web应用系统开发的进一步发展，简化了软件开发过程。然而

学位

代码自动生成系统业务逻辑业务规则建模产生式规则

基于视觉导航的车道线检测与跟踪技术研究

近年来,随着经济的发展,现有的道路运输系统已不能满足当前社会发展的需要。各国政府和科研机构都将大量精力投入到(Intelligent Transportation System,ITS)的研究。其中汽

学位

车道识别视觉导航摄像机标定Canny算法跟踪技术仿真平台

基于无线传感器网络的室内老年人定位系统研究

在我国人口老龄化的背景下,空巢老人和独居老人的数目不断增加,与此同时对于老年人的监护需求快速增长。实时确定老年人所在的位置才能为老年人提供优质服务,而无线传感器网

学位

无线传感器网络室内定位RSSI定位精度

SEM下三维可视化遥纳操作系统研究

面向微纳级操作对象的控制系统,其操作过程中会呈现出诸多与宏观操作不同的现象和特点,这对系统的灵活性、可靠性和高效性提出了更高的要求。本文结合SEM视觉辅助、力觉反馈

学位

遥纳操作虚拟现实力觉交互SEM图像

基于机器视觉的交通信息采集算法及其嵌入式系统实现

随着社会经济的发展,私有车辆的迅速增加,城市正面临着越来越严重的拥堵与交通事故。为了能够舒缓交通压力、减少交通拥堵、降低事故发生率,准确的交通信息采集是其中的关键

学位

机器视觉交通信息采集算法虚拟线圈阴影消除背景更新嵌入式系统

基于多模态融合的视频内容分析及其个性化定制

视频内容分析是当前多媒体领域的热点研究问题之一,是视频数据检索、浏览、和管理的关键技术。它能够对视频内容按照不同的语义概念标注关键字,从而为后续的数据管理、检索和

学位

多模态融合视频内容个性化定制挖掘文本

关联记忆与关联信息处理的fMRI研究

记忆是人类最基本的认知功能之一，也是人类进行其他高级认知活动(学习，问题解决等)的基础。内侧颞叶与记忆有着密不可分的关系，研究表明内侧颞叶是一个具有整合高级信息的重要神

学位

海马旁回情节记忆关联信息处理功能核磁共振成像学习测试脑图像数据

水中仿生机器人协作仿真平台的设计与实现

为辅助水中仿生机器人协作相关科研工作,推动水中机器人二维仿真比赛的发展,本文设计并实现了一套基于微软公司机器人开发者工作室(MicrosoftRobotics Developer Studio,MRDS

学位

仿生机器人机器人协作运动控制模拟仿真

基于BOW和PLSA模型的物体识别方法

与本文相关的学术论文