基于2D和3D SIFT特征融合的一般物体识别算法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:13439718
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机视觉、人工智能、机器人和模式分类等科学技术的发展与进步,自动物体识别(Automatic Object Recognition, AOR)系统已经发展成为人工智能领域的重要研究方向之一。一般物体识别(Generic Object Recognition, GOR)作为物体识别系统中的主要组成部分,在智能监控、遥测遥感、机器人、医学图像处理等方面有着广泛的应用前景。由于真实环境中一般物体存在类内差异明显、类间相似度高、同一物体在视角变化时差异巨大等问题,导致一般物体识别算法正确识别率低下。选择合适的特征表示一般物体类内共性、类间差异等特性至关重要,提取稳定而有效的特征才能在有限的训练样本下得到最好的识别结果。本论文针对上述问题,提取物体二维特征和三维特征,利用多特征融合完成一般物体识别过程,主要内容如下:一般物体识别中特征提取与表示至关重要,在尺度不变特征转换(Scale Invariant Feature Transform, SIFT)即2D SIFT特征的基础上,提出了基于点云模型的3D SIFT特征描述子,并利用多种特征融合算法实现两特征融合,提出一种基于2D和3D SIFT特征融合的一般物体识别算法。本文提出的一般物体识别算法的特点在于:(1)将2DSIFT特征描述子扩展至基于点云模型的3D SIFT特征描述子,提取物体的2D和3DSIFT特征作为其特征表示,并利用经典的统计学模型“词袋”(Bag of Word, Bo W)模型实现物体描述;(2)运用有监督分类器支持向量机(Support Vector Machine, SVM)实现分类训练和识别;(3)利用四种特征融合算法实现特征融合,分别为:特征级融合以及决策级融合中的平均加权融合、DSmT(Dezert-Smarandache theory)融合和Murphy融合,根据融合结果给出最终识别结果,从而完成一般物体识别任务。最后,通过针对一般物体识别的一系列仿真实验,表明本文提出的一般物体识别算法在类内差异明显、类间相似度高以及视角发生变化等情况下仍然能够保持较高的正确识别率和鲁棒性。
其他文献
非接触式感应耦合电能传输(Inductively Coupled Power Transfer,ICPT)技术,是一种新型的电能传输技术,它通过高频磁场搭建供电设备与用电设备之间的能量传输通道,实现了非接触方式传输能量,以其高可靠性、高安全性、低维护性等优点得到了迅速的发展。由于LCL复合谐振型ICPT系统比传统的单级LC谐振型ICPT系统有更大的谐振容量,在传输同等大功率等级下,这种系统的开关管
随着互联网、移动通讯、无线网络、个人多媒体业务以及工业网络中大量多媒体数据的出现,对路由器的队列调度和队列管理能力的要求越来越高。路由器在转发传统数据包业务的同时
现实世界的很多问题都是多目标优化问题。在多目标问题中,各目标之间通常不是独立存在的,往往互相冲突,因而,不存在单一解向量使得所有目标最优,这使得多目标问题难于优化。
随着信息技术的发展和工业过程自动化水平的不断提高,多相流在工业过程中出现的频率越来越高,从而在科学研究和工业过程中对多相流参数的实时检测提出了更高的要求,对多相流
视觉里程计(Visual odometry,VO)是一个利用与运动物体相关联的单目、立体或者三维相机获取图片信息,进而通过计算图片间的关联关系来估计物体运动情况的装置,可为视觉导航定
新闻节目作为人们获取信息的一种方式,在人们日常生活中起着非常重要的作用。基于新闻视频的字幕检测与提取是基于内容的视频信息分类检索的一部分,是多媒体信息处理研究领域中
随着森林在环境中的作用日益显著,人们开始对森林环境进入更深入的研究,相关研究已由基本的森林资源对大气环流的影响领域扩展到如何保护森林资源,从而让森林发挥应有的作用,
近年来,对于具有多变量、非线性、变量间有多重相关性特点的复杂系统的建模,采用较多的是利用神经网络、模糊逻辑等智能方法建立单一模型。然而,对辅助变量采用单一的函数关
随着现代科技的发展,交流伺服技术的应用领域更为广泛,所发挥的作用越来越突出,对其性能指标的要求也越来越高。交流伺服系统是一个具有非线性、耦合性和时变性的复杂系统,常规的控制策略难以取得理想的控制效果,本文针对交流伺服系统高品质的控制要求以及其存在的摩擦非线性、系统参数变化、负载扰动等问题,研究了一种RBF神经网络与PID控制相结合的复合控制策略。本文首先建立了包括摩擦非线性在内的交流伺服系统动力学
声纹识别(Voiceprint Recognition)也叫做说话人识别,其主要任务是通过人的语音中提取的特征来识别或确定未知用户的身份。声纹识别所提供的安全性可与指纹识别、掌纹识别、虹膜