基于Kinect深度图像的静态手势识别的研究与应用

来源 :东北大学 | 被引量 : 6次 | 上传用户:hermes262
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的不断进步和计算机的普及,人机交互的方式也趋于多样化。从传统的键盘,图形用户界面,平板电脑的手写汉字到最近火热的语音识别,体感外设的手势。这些人机交互的方式无疑都在朝向自然化和便利性的方向发展。手势以其直观性和自然性的特点,已经成为人机交互的一种重要手段。它摆脱了传统键盘鼠标等方式的束缚,更加符合人类自身的习惯,因此具有非常广泛的应用前景。本文也选取了手势识别作为研究课题。传统的手势识别技术主要包括基于佩带设备的手势识别和基于计算机视觉的手势识别。基于佩带设备的手势识别是指利用数据手套或者三维设备进行的手势识别方法,限制了自然的人机交互。基于视觉的手势识别研究包含了很多算法,但是这些方法在手势分割时易受光照、背景和摄像头特性等因素影响,导致识别率并不高。本文在前人的基于视觉手势识别的研究基础上,对手势识别技术做出了探索研究。主要的研究思路是借助Kinect深度和彩色传感器获取手势的深度和彩色图像数据并结合基于视觉的手势识别方法,对手势进行分析和识别。这种方法能够很好地解决因光照和背景等因素对手部区域分割的影响。本文主要针对静态手势进行识别。其研究思路是利用深度图像直方图寻找合适阈值分离前景和背景场景,然后使用肤色信息检测分割出手势区域。这种方法能够提取出比较理想的手部区域,然后对手势区域提取hog特征描述子作为特征向量。最后选取K近邻(K卜N)作为静态手势的分类器进行训练。K近邻在类别决策时,只与极少量的相邻样本有关,因此,K近邻可以较好地避免样本不平衡的问题。采用本文提出的手势识别算法对五种比较常见的静态手势进行实验,并实现了一个小型的手势识别系统,最后本文对实验数据进行了实验和分析,从算法的识别率以及光照和旋转、平移和尺度变化等条件对识别结果的影响方面得出了相应结论,从而验证了该手势识别方法的可行性和鲁棒性。
其他文献
当今随着经济环境的全球化,企业面临着越来越激烈的竞争。工作流引擎是工作流管理的技术核心,是实现企业业务流程运行、管理与集成,从而最终实现业务流程的自动化的核心技术
火力发电厂设备检修是电厂管理者甚为关心的问题。网络计划技术是一种广泛应用在各个生产领域中的科学管理方法,网络计划图是网络计划技术的表现形式。电厂机组检修是保证电厂安全生产的一项重要工作,而机组大修网络计划图的应用可以大大提高电厂机组检修工程的效率。 本文在详细调研基础之上,通过客户需求分析、所需算法的研究和实用化功能设计,提出了网络计划图绘制软件系统的设计方案;并且根据项目管理技术设计出了关键路径
软件开发过程的控制和管理一直是软件工程与项目管理领域的研究重点,在各种计算机应用软件开发过程中起着举足轻重的作用。但是目前的各种理论和方法的研究或者过于抽象,可操作
“物以类聚,人以群分”,聚类伴随着人类社会的产生和发展而不断深化,人类要认识世界就必须区分不同的事物并认识事物间的相似性,而每个概念的最初形成无不借助于事物的聚类分
随着信息技术高速发展,人类社会正进入信息社会,社会经济的发展对信息资源、信息技术和信息产业的依赖程度越来越大。在信息社会中,信息资源已成为比较各国技术力量和综合国力的
传统的软件技术体系本质是一种静态、封闭的结构框架,软件实体缺乏动态适应能力、缺乏自主性、难以根据应用需求进行动态协同,因此难以适应Internet开放、动态和多变环境的要求
该文的研究工作包括:从Web数据库的四个关键技术入手,详细分析研究了Web数据库系统的体系结构、Web与数据库的接口技术、Web数据库系统设计与OOAD(Obiect Oriented Analysis
基于Linux平台的应用软件开发已经成为计算机软件产业的新兴发展趋势,总结并探索Linux平台下的应用软件架构思想与开发方法有着重要的应用价值。本文针对Linux平台下复杂软件
当前,互联网已发展成为全球性的信息网络,其规模和用户数量仅次于公用电话网(PSTN)和有线电视网。原有的传统电信网络与新一代网络还将并存相当长的时间。所以无论在技术上还
信息物理融合系统(Cyber-Physical Systems, CPS)是综合了计算、通信和控制技术于一体的新型智能复杂系统。CPS深度融合了信息资源与物理资源,将再一次掀起信息产业的浪潮。