基于深度学习的手势识别技术研究

来源 :东南大学 | 被引量 : 2次 | 上传用户:maotian1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手势交互是现在人机交互中主流的方式,也是多种人机交互中的研究热点。手势交互从之前依赖于数字手套,肌电等外接硬件设备,到现在逐渐发展成使用计算机视觉算法来解决手势交互中的问题。基于计算机视觉的手势交互方法不需要借助外界设备,符合人们日常与计算机的交互习惯,在其中最需要解决的问题就是如何提高手势识别的准确率和速度。而近几年,深度学习的迅速发展,使得计算机视觉内很多问题都得到了很好的解决。因此,本文将深度学习的相关方法应用于手势识别问题中,解决了复杂环境及受人脸等物体干扰的情况下的手势识别,并且提出了一些改进方法,对相关算法的速度进行了提升。本文分析了多种传统手势分割算法,针对传统手势识别算法存在的问题,如易受到复杂外界环境干扰,对手势高自由度,容易形变等特性不具有鲁棒性等缺点,提出基于全卷积神经网络的手势分割算法。卷积神经网络通过网络学习丰富的特征,代替手工设计特征,因此基于全卷积网络的分割准确率相对与传统方法有了很大的提升。本文还对全卷积神经网络的网络结构进行进一步优化和改进,将网络结构压缩为四层卷积层和一层反卷积层,最终得到的网络模型真正率为93.8%,假正率为5.3%,网络在GPU下运行速度为18ms,满足人机交互的实时要求。整个模型能够处理如人脸等类肤色物体对手势分割结果的影响,对不同环境,不同光照,不同角度的手势具有较高的鲁棒性。本文对传统手势识别系统的各个模块进行了研究,指出传统手势识别的结果依赖于其他模块的准确性,整个系统容错性不高,准确率较低,易受到复杂环境,手势变化等因素的干扰。针对这一系列问题,本文设计了一种基于目标检测网络的手势识别算法。该算法在一张图像上同时完成对手势类别和位置的密集预测。本文还对网络结构进行了改进,将前置基础网络进行拆分并化简为小网络。在使用网络检测出手势之后,使用跟踪算法,实现了基于跟踪的手势检测。使用改进的网络后,单张图片的检测时间为110ms,识别准确率为81.2%,在此基础上使用基于跟踪的检测方法,整个算法平均检测速度为33ms每帧。实验证明,该算法解决了复杂环境,人脸等身体部位等因素对识别的干扰,对手势的高自由度,形变等具有鲁棒性,能够实时跟踪检测手势,满足了实时手势交互的要求。此外,本文还建立了一套具有高质量的、像素级的手势分割数据集和手势检测数据集,用于对本文提出的网络进行训练和测试。
其他文献
基于计算机局域网技术、现场总线技术和RS485通信技术,结合数据库技术,利用接口软件有效地解决了物流管理系统与自动控制系统的实时联网通信问题。该文主要以上海某学校的大型
[目的]了解昆明市物质滥用人群的物质滥用情况、多药滥用情况及目前健康状况,为进一步研究和改善该人群健康状况提供科学依据。[方法]从2017年-2018年期间前来云南省药物依赖
现阶段我国的小学建筑设计多从小学的功能和空间出发,只满足基本的使用需求,建筑设计千篇一律,设计过程中也多由学校校长、建筑师等成人来做决定,存在对儿童的心理和行为考虑不足的问题。小学是一个人度过童年时代的地方,一个人的启蒙也从这里开始,小学建筑设计对儿童成长和日后的发展尤为重要,儿童的心理和行为应该在小学设计中得到充分的考虑。本论文首先对儿童心理和行为的相关理论进行研究,从中寻找出小学建筑设计与儿童
近年来,硅基光子学因在全光通信网络的发展中有着不可替代的作用而引起了人们极大的研究兴趣。利用硅基波导的非线性可以展宽或者压缩频谱,这为我们获取中红外超连续谱和窄线宽光源提供了有效的方法。目前,利用光纤介质产生超连续谱和频谱压缩的方案需要较长的光纤长度和较高的泵浦峰值功率,这些不利于光子集成和系统稳定性。本文设计了几种结构简单的硫族化物波导,研究了中红外波段超连续谱产生和频谱压缩的非线性动态。一方面