基于Kinect的三维手语识别

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:wdyyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手语是聋哑人和外界交流的主要途径,对手语识别的研究有助于听障群体与其他人进行交流,并无障碍的享受社会提供的服务。  在对手语识别进行研究的基础上,我们也对手语识别相关的手部跟踪和手型分割工作进行了研究。对于所要解决的基于Kinect数据的手语识别问题,在研究了手部跟踪和分割的工作后,不同于现有的HMM框架下的手语识别方法,接着提出一种基于轨迹和关键手型片段融合的手语识别方法。具体的工作如下:  首先针对RGB-D手语视频数据中手部形变较大及运动过快的问题,提出融合手型、深度和位置三通道特征的手部跟踪方法。结合人脸检测功能,通过自动建立肤色模型来实现手部的自动检测,以此来确定跟踪目标,然后利用手型、深度和位置三通道特征构造目标估计函数和优化能量函数,实现双手的跟踪工作。在300个视频44810帧中,手部的跟踪成功率为91%。  然后根据手部所处的不同位置,把手的状态主要划分为双手分开、双手重合和手脸重合这三种存在情况。对于双手分开的手型,我们利用肤色和深度进行分割;对于双手在一起的手型,认为此双手作为一个整体,不再对左右手进行单独分割;对于手脸重叠的手型,从肤色和深度上已经无法将手部和脸部区分开,可以利用手脸重叠前的脸部信息去剔除脸部的干扰,得到纯净的手型图。  最后,由于手语的判别信息绝大部分集中在关键手型片段中,所以提出只需要全局轨迹和关键的手型片段进行手语识别的方法。利用并行的HMM框架进行轨迹识别和关键手型片段识别,然后在决策层进行融合,在370个手语词汇中,首选识别率达到92.64%,其性能与传统的HMM方法可比,同时极大地减少了时间的消耗。
其他文献
随着软件系统规模和复杂性的不断增加,软件体系结构在软件开发中的作用显得越来越重要。近年来软件工程界提出了许多描述软件体系结构的方法,本文在充分研究了软件体系结构,
本文通过研究在一个实时系统中会有多类型任务的出现,将实时任务按照到达模式和截止时间类型两个纬度进行分类。并且在分析了诸多的调度算法中,对截止时间单调调度算法进行了
在计算机三维仿真应用中,数字地形模型系统占据了相当重要的地位,对整个应用的用户感官感受起到了非常大的影响,利用数字地形模型,三维仿真系统能实现整个场景的漫游,能更好的使用
随着Internet上的多媒体信息的日渐丰富,人们需要传输大量的视频、音频等二进制数据。传统的多媒体资源传输方式是客户端/服务器模式——客户端获取资源,服务器端发布资源。
随着先进制造技术研究与应用的不断深入,产品数据管理(PDM)和计算机辅助工艺设计(CAPP)己成为制造业实施生产自动化和企业信息化的重要组成部分。为了解决传统CAPP系统存在的
图形处理单元(GPU)具有价格低廉和计算能力强大等特点,这使其近年来在高性能计算领域日益风靡。新的编程语言CUDA和OpenCL的出现使得GPU编程变得广为接受,但是GPU编程仍然是很复
Web服务作为新一代的开放分布式处理技术,具有高度的互操作特征,易于将一些现有应用集成为新系统。但随着Web服务广泛使用,如何动态地进行Web服务的交互及集成成为软件技术研
近年来,数据挖掘己经引起了信息产业界的极大关注,这是快速增长的数据量和日益贫乏的信息量之间矛盾运动的必然结果,对数据挖掘技术进行系统、深入、全面、详尽地研究是全球
Internet的飞速发展使得人们能够更加方便地通过网络进行协同工作、发布各种形式的多媒体产品,如文本、图像、音频、视频以及三维模型等。然而,便捷的网络环境也使得非法占有、
在全面介绍了基于内容的图象检索的底层视觉特征——颜色、形状和纹理特征的提取方法、相似性度量方法及检索算法评价指标后,论文着重研究了颜色直方图及包含图象空间信息的