基于特征融合与机器学习的RGB-D图像识别技术研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:homejang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与传统的基于二维图像的识别相比,三维的图像识别由于其引入的深度信息,使得其具有更高的准确率和鲁棒性。这是因为三维的RGB-D图像不仅包含了二维图像的颜色、纹理信息,其中的深度图像还包含了目标的表面几何信息。随着Kinect、Xtion等三维体感设备的兴起,RGB-D图像的获取越来越便捷,RGB-D图像的识别技术也越来越成为机器视觉领域的研究热点。另一方面,近年来机器学习在图像识别领域取得了令人瞩目的成绩,特别是卷积神经网络,在大规模数据集的图像识别任务中取得了突破性的进展。基于机器学习算法的RGB-D图像识别成为了机器视觉中的热点问题。针对以往RGB-D图像的特征提取算法存在计算复杂、特征提取不充分以及特征信息冗余等问题,本文提出了一种RGB-D图像的彩色-深度局部Gist特征提取算法。首先将RGB图分解为R、G、B三个通道的图,分别提取三个通道图的局部Gist特征,同时提取深度图的局部Gist特征,通过按行融合的方式组成RGB-D图像的彩色-深度局部Gist特征。对彩色-深度局部Gist特征使用主成分分析法降维后,用K-means++算法聚类构建RGB-D图像的视觉词典,最后基于支持向量机分类器对RGB-D图像进行分类。实验结果表明本文的特征提取算法可以有效提高RGB-D图像分类的准确率。鉴于目前卷积神经网络在大规模图像数据集上的优异表现,本文提出一种改进的双流卷积神经网络的RGB-D图像识别算法。该算法设计了两个结构相同的卷积神经网络分别以RGB图与深度图的彩色映射作为输入,两个网络独立训练,再在全连接层进行网络的融合。针对融合的方式,本文设计了一种最优权值法,即根据两个网络的识别准确率赋予两个网络不同的融合系数。通过实验表明,改进的双流卷积网络识别准确率比单输入卷积网络的高,且采用最优权值法提高了双流卷积神经网络的RGB-D图像识别准确率。
其他文献
简要介绍了Windows平台下NDIS和NDIS中间层驱动程序的基本特点,着重介绍了NDIS中间层数据包管理以及它的设计方法.最后给出了基于NDIS中间层驱动程序的虚拟专用网(VPN)客户端
<正> 在第十五届"五羊杯"全国象棋冠军赛上江苏徐天红与黑龙江赵国荣以对攻激烈的顺手炮兵戎相见,布局未几即短兵相接,(附图)是双方刚刚交手七个回合时走成的盘面;现轮红方走
期刊
突出煤层开采主要有开采保护层和预抽煤层瓦斯2种区域治理措施。在三组四层煤、层间距大的煤层群联合开采条件下,回顾了平煤八矿瓦斯治理发展历程,分析研究了戊9-10、己15、
对放在锥型底座上内径为54.4 mm的7组不同壁厚A3无缝圆钢管进行了轴压作用下撕裂卷曲破坏的实验研究和理论分析,实验过程中记录了载荷-位移曲线和试件螺旋状残余变形模态;理
阐述了首都环境优美乡镇创建对促进农村地区环境保护建设及改善环境质量作用的同时,对环境优美乡镇建设的环境经济效益进行了分析;并指出北京市环境优美乡镇创建中存在的问题,提
<正> (附图)是九五年八月在青岛举行的"华天杯"全国象棋精英赛上"拼命三郎"于幼华与"羊城少帅"吕钦以飞相对士角饱交手⒂回合时的枰面;眼下红方炮骑河串打,且看黑方如何应对?
期刊
针对大阳泉矿15号煤层强烈动压巷道托顶煤支护技术难题,采用现场调研、理论分析、现场试验与测试、支护材料优化更新、现场跟踪与矿压监测等方法,对大阳泉矿15号煤层厚煤层托
随着天文科学的发展,为了获得宇宙更深处微弱信号的高质量图像,对望远镜的分辨率的要求越来越高,为了获取更高的分辨率,望远镜的口径也将越来越大。但运载火箭的运载能力和包络尺寸限制了望远镜口径的增加,在轨组装技术成为解决这一矛盾的有效途径。各航天大国纷纷展开在轨组装望远镜技术的研究。热控系统是望远镜在轨正常运行、获得高质量图像的重要保障,由于在轨组装望远镜在体积、结构等方面与传统航天器存在一定的差别,包
建筑业在国民经济中一直处于稳定发展的地位,但整个行业利润率水平普遍较低,同时每年有大量企业投身建筑行业中。建筑企业面临着激烈的竞争压力,迫切要求其加强对自身的管理。对建筑企业而言,工程项目是其基本构成单元,只有提高工程项目的整体水平才能提升整个企业的竞争能力。本文主要从工程项目绩效考核方面进行研究,希望能够对项目管理水平提高起到促进作用,从而提升企业竞争力。本文主要以委托代理理论、项目管理理论和绩
MPEG(Moving Picture Expert Group)任务是给用于数字存储介质、电视广播和通信的运动图像和它的伴音制定一种通用的编码方法。MPEG2是建立在MPEG1之上,文中首先将MPEG2与MPE