基于BOW和PLSA模型的物体识别方法

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:wreck2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,移动机器人已经被广泛应用到了工业、航天、军事、服务等诸多领域。随着应用领域的拓展,人们对移动机器人的智能性要求也越来越高。由于视觉系统是最接近人类感知环境的方式,且能够为移动机器人提供丰富的感知信息,因此,基于视觉的环境感知问题成为智能机器人领域的研究热点,吸引了大量的研究人员参与。物体识别是移动机器人环境感知与导航定位的基础和核心,研究此类问题对提高机器人智能化水平的具有重要的科学意义和实际应用价值。在真实的动态复杂环境下,机器人视觉所拍摄的图像不可避免地存在视角、光照、尺度等变化,给研究物体识别问题带来极大挑战。本文针对移动机器人感知实际环境所面临的上述问题,研究基于BOW和PLSA模型的物体识别,主要内容包括:  (1)研究了基于尺度不变特征和词袋模型的物体识别方法。特征提取是物体图像识别过程中的一个关键步骤,其提取结果的好坏对识别结果起到至关重要的作用。图像局部特征因其包含了人类感兴趣的重要目标,最能表达图像的内容,受到越来越多的研究人员所关注。本文在分析比较几种常用的特征描述子的基础上,考虑到虽然SIFT特征对光照变化、视角变化和缩放等具有不变性,在物体识别中能够获得较好的匹配效果,但同时也存在识别时间较长的问题,因此,研究了基于SIFT局部特征和词袋模型的(Bag of Words,BOW)物体识别方法:采用BOW模型重构图像特征,将图像的局部特征矢量量化成视觉单词,根据图像视觉单词出现的频率完成物体图像识别。实验结果表明,该方法能够保持SIFT局部特征在物体识别中所具有的优势的同时,大大减少了物体识别的时间,更好地满足移动机器人视觉导航的实际应用需求。  (2)提出一种改进的词袋模型(IBOW)物体识别方法。传统的BOW模型虽然满足了实时性的要求,但是识别率会有所降低。为了更好地实时处理具有复杂的非线性变化的图像,并能满足机器人对实时性的要求,在传统BOW模型的基础上,引入词频.逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)权重计算方法,计算视觉单词在特征集合的权重,根据权重大小保留具有较强区分能力视觉单词。分别在不同的数据集上进行了实验,结果表明:与传统的BOW模型相比,IBOW模型的物体识别方法在保证实时性的同时,具有更高的识别率。  (3)提出了一种改进的概率潜在语义分析(IPLSA)物体识别方法。传统的分类模型虽然对在不同时间、地点下的同一个物体有较高的识别结果,但是对每个个体都存在外观、形状差异的同类物体,仅凭借图像的底层特征信息,而不考虑跨越语义鸿沟的方法显然具有较大的局限性。为了缩小语义鸿沟以及应对复杂图像识别问题,本文借鉴文本信息检索领域中概率潜在语义分析方法(Probabilistic latent semantic analysis,PLSA),通过对图像进行语义建模,计算每幅图像的潜在主题,来达到对同类物体图像识别的目的。实验表明:针对同类物体的识别,PLSA方法相比传统的分类模型具有优越性,但是由于传统的PLSA方法只计算视觉单词之问的语义信息,却忽略了视觉单词的空间信息,其识别效果仍不能满足移动机器人实际应用。针对此问题,本文提出一种改进的概率潜在语义分析模型(Improved-PLSA):考虑到视觉单词之间的空问信息,通过建立起局部描述子到某种局部语义概念的映射,再利用图像中局部语义概念的分布来实现图像的分类识别。实验证明:改进的概率潜在语义分析(IPLSA)模型比传统的PLSA模型具有更高的正确识别率,而且整个训练模型的过程都是离线完成,因此,所提出的方法可以应用于移动机器人的视觉任务。  (4)在以上算法研究的基础上,利用OpenCV和C/C++技术构建了一套基于局部显著特征的物体识别软件原型系统。该系统具有特征提取与分析,物体识别等功能,同时具有较好的可视化效果。软件测试结果表明,所构建的系统原型具有较好的鲁棒性。
其他文献
基因芯片,又称DNA芯片或DNA微阵列,它们是DNA杂交探针技术与半导体工业技术相结合的结晶,并伴随着“人类基因组计划”而发展起来的一门新兴技术,具有高通量、大规模、平行性等特
本文在北京市自然科学基金项目“基于惯性和视觉传感器的移动机器人位姿估计(4082032)”的支持下,以中国科学院自动化研究所的智能轮式移动机器人AIM为实施平台,进行移动机器
随着社会进步和网络技术的不断发展,web应用系统在信息化建设中得到广泛应用。构建在J2EE平台上的各种框架与技术,促进了web应用系统开发的进一步发展,简化了软件开发过程。然而
近年来,随着经济的发展,现有的道路运输系统已不能满足当前社会发展的需要。各国政府和科研机构都将大量精力投入到(Intelligent Transportation System,ITS)的研究。其中汽
在我国人口老龄化的背景下,空巢老人和独居老人的数目不断增加,与此同时对于老年人的监护需求快速增长。实时确定老年人所在的位置才能为老年人提供优质服务,而无线传感器网
面向微纳级操作对象的控制系统,其操作过程中会呈现出诸多与宏观操作不同的现象和特点,这对系统的灵活性、可靠性和高效性提出了更高的要求。本文结合SEM视觉辅助、力觉反馈
随着社会经济的发展,私有车辆的迅速增加,城市正面临着越来越严重的拥堵与交通事故。为了能够舒缓交通压力、减少交通拥堵、降低事故发生率,准确的交通信息采集是其中的关键
视频内容分析是当前多媒体领域的热点研究问题之一,是视频数据检索、浏览、和管理的关键技术。它能够对视频内容按照不同的语义概念标注关键字,从而为后续的数据管理、检索和
记忆是人类最基本的认知功能之一,也是人类进行其他高级认知活动(学习,问题解决等)的基础。内侧颞叶与记忆有着密不可分的关系,研究表明内侧颞叶是一个具有整合高级信息的重要神
为辅助水中仿生机器人协作相关科研工作,推动水中机器人二维仿真比赛的发展,本文设计并实现了一套基于微软公司机器人开发者工作室(MicrosoftRobotics Developer Studio,MRDS