基于深度学习的手势识别研究

被引量 : 27次 | 上传用户:windcode2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的飞跃发展,人机交互越来越频繁的发生在更多人的身边,为许多人的生活带来了方便,其中人机手势交互是最为活跃的一个领域。然而手属于非刚性物体,变化丰富,使得手势识别的难度加大了不少。自2006年来深度学习(Deep Learning,DL)有了长足的发展,它给人工智能带来新的希望,它优异的表现给了我们足够的信心来完成手势识别这项任务。手势识别是一个复杂的系统,通常基于计算机视觉的识别系统包括手势定义、图像的获取、处理、分析、理解。一个好的识别系统往往离不开一个好的前期处理,但是这并不代表图像的前期处理是最重要的,在本课题中我们把重点放在了手势识别的算法研究上。在手势识别的实现过程中我们分别从深度学习两个主要方面入手,一是采用基于限制玻尔兹曼机(Restricted Boltzmann Machine,RBM)的DL网络,二是采用以基于Le Net-5卷积神经网络(Convolutional neural network,CNN)的DL网络。本文还提出了一种CNN和RBM联合网络:利用多个RBM形成堆积式网络进行无监督特征提取,再结合CNN的有监督特征提取,最后融合这两类特征进行分类。仿真结果表明我们提出的联合网络在识别背景简单的手势样本中有更好的表现,而对于复杂背景的手势样本的识别能力则还有待提高。另外,DL相对于传统三层神经网络有明显的优势,同时DL极大改善了多层网络的训练问题,从我们的仿真过程中可以看出多层DL的性能要好于传统浅层网络。针对无人机的手势控制,本文首先定义了十类基本手势,同时又分为简单背景下的手势样本和复杂背景下的手势样本,并对这些样本做了简单的前期处理。在静态图像识别中使用了五种网络,分别是深度信念网络(Deep Belief Networks,DBNs)、深度神经网络(Deep Neural Network,DNN)、CNN、CNN和RBM的联合网络以及传统三层神经网络。针对视频流中的手势识别,本文划分了三个环节分别是检测、跟踪、识别,并做了详尽的介绍。其结果表明CNN能很好的适应复杂环境下手势的检测、跟踪、识别。
其他文献
伴随着信息化技术的兴起和发展,信息化技术的分支——信息共享和网络数据库得到广泛地运用。现代企事业需要生存和发展就必须进行信息化技术建设。越来越多的企事业单位将所
教师树立高尚的师德,必须重视教师的师德修养,具有高尚的教师职业道德。首先必须要有一颗热爱学生的心,才能使学生“信其道,乐其道”,爱的教育是推动教学成功的巨大推动力。
<正>"ERP"即"Enterprise Resources Planning——企业资源计划",源于上世纪80年代初提出的MRP-Ⅱ(Manufacturing resources Planning,制造资源计划),20世纪90年代在欧美得以
<正>根据我省《关于组织开展全省职业学校"五课"教研工作和"两课"评比活动的通知》精神,市教研室在各辖市区初评的基础上进一步进行了筛选,评比的主要内容为教学设计和说课。
<正>我国对环境会计的研究始于上个世纪90年代初期,以葛家澍教授发表的一篇关于绿色会计理论的文章为标志,揭开了我国学术界环境会计研究的序幕。迄今为止,对环境会计的研究
正当防卫是法律确认的公民同违法犯罪行为作斗争的一种法律手段,是公民的一种特殊权利,也是公民的一项道德义务。公民要有效地运用这一法律手段,正确地行使这一特殊权利,履行
近年来随着网络技术的不断发展,接入网络的方式不断优化,越来越多的用户数据出现在互联网上。面对这种井喷式出现的数据,当前业界的大部分数据分析系统都还是传统的基于磁盘
<正>敬畏,就是敬重又畏惧。古人云:"不自重者致辱,不自畏者招祸。""天下之事,成于惧而败于忽。"每个人特别是领导干部,要懂得敬畏,要有所"怕"才好。领导干部在大胆工作、
提出了一种工作压力45MPa的应用于高压气源系统中的油气分离器的设计方法,这种油气分离器具有结构紧凑,使用寿命长,油气分离效果好,压力高及操作方便等优点,可广泛用于国防工
本文以2008-2012年我国沪市A股违规受到处罚的上市公司为样本,运用舞弊三角理论检验了可能导致上市公司发生违规行为的压力、机会和借口三大要素的显著性。结果表明:流通股比