面向人机交互的常见桌面手势识别

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:pengweimin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自第三次科技革命以来,计算机技术的迅猛发展大大促进了人类文明的现代化。伴随着计算机技术的发展,人机交互的方式也不断革新,从传统的鼠标键盘到现在流行的触摸屏,再到更先进一点的语音控制,其特点也越来越人性化越来越以人为本。手势交互作为一种新颖的人机交互方式在近些年也越来越流行,它在遥操作系统、智能家居、虚拟现实等领域得到了广泛的应用。手势交互相对于传统的人机交互方式有着无接触操作、简单易学、自然自由、可携带信息量大等优点,因此对基于手势的人机交互技术的研究有着重要的意义。  通过手势进行人机交互时,如果使用复杂的背景则会影响计算机对手势理解的准确度,而桌面背景环境相对简单。本文探究了桌面背景环境下的常见手势交互方式,提出了一种桌面环境下的常见动态手势识别与理解方法,包括“去”、“拿”、“移”、“放”、“回”、“这”等多种自然交互手势。与一般静态手势不同,动态手势还包含了大量的时序信息,对其中时序信息的提取往往是动态手势识别的关键。目前流行的时序特征提取方法往往是基于RNN(递归神经网络),基于RNN和CNN(卷积神经网络)往往可以很好地实现动态手势的识别。上面这些方法都是在网络结构层来实现时序特征的提取,而本文提出了一种在输入层提取时序特征的方法,并取得了不错的效果。  该算法首先对输入每帧图像预处理,基于桌面环境的背景建模以及基于手部区域的肤色建模,两种算法结合能很好地完成手势前景的分割。然后融合多帧图像之间的时序信息,完成基于手势前景分割的时序特征建模,构造动态手势时空特征影像,其包含了动态手势的形状信息以及时序信息,能够很好地区分不同的动态手势。最后基于CNN完成对手势时空特征影像的训练与识别,并基于统计分析的方法对结果进行优化处理,进而实现对不同手势动作良好稳定的识别与分类。
其他文献
粗糙集理论是处理不确定性问题的新的数学工具,是粒计算的一个重要的研究分支。在粗糙集理论研究中,对属性重要性、属性核以及属性约简的求解是粗糙集理论研究中的几个主要的
变型设计应用相似性、重用性和全局性原理对定制产品进行重组,提高已有零件使用率,增加客户选择范围。根据客户定制需求,以批量生产的方式,低价、高质、高效的生产出定制产品
粗糙集理论是一种分析不精确、不一致、不完备数据的有效工具。然而,等价关系约束下的经典粗糙集模型只能应对离散化形式的数据,具有很大的局限性。基于相容关系知识表示的粗
目前,混沌图像加密算法得到了深入的研究,但是仍然存在一些问题,如加密算法过于单调、与明文的相关性较弱、分块规则固定等,为了克服存在的这些问题,本文设计出几种混沌图像
摘要:随着计算机技术的发展与医院信息化的普及,越来越多的医院使用数字图像作为医疗图片的存储与传播的主要方式。由于医疗图片中包含了病人的个人隐私,若图片中的信息发生了
近年来,随着计算机技术的快速发展,图像处理应用越来越广泛和深入,对具有较大视域全景图像的需求也越来越迫切。全景图像拼接作为新兴技术,短短几年得到了快速发展,受到研究者越来
  随着互联网Web2.0技术的不断发展及应用软件的不断成熟,软件即服务(Software as a Service,简称SaaS)模式,作为一种创新型的软件网络应用模式应运而生。在这种模式下,应
翼型设计是飞行器设计中比较重要的步骤,影响着飞行器的主要飞行品质。在进行翼型设计时,传统的风洞实验和CFD技术周期长、成本高。为了降低成本、提高翼型的设计效率,作为对现
随着IP网络的快速发展,人们已经越来越习惯使用IP网络来完成所有的事情,目前IP网络已经完全主宰了互联网络,照这个形式发展下去,今后的电视传输网络、电话交换网络也将不可避免被
最近几年,深度学习越来越受到人们的普遍关注。尤其是深度学习算法之一卷积神经网络(Convolutional Neural Network,CNN)变得越来越重要。因此,图像识别和图像分类逐渐成为计算机