基于视频的徒手手语识别方法的研究

来源 :大连海事大学 | 被引量 : 2次 | 上传用户:liongliong525
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机性能的逐步提高和各领域对计算机使用的不断深入,用户对计算机使用方便程度和人机交互的自然性要求程度越来越高,尤其在虚拟现实和可穿戴计算领域中更为明显。因此,直观、自然和友好的多模式人机交互方式很有必要。在日常生活中,人与人之间交流使用的自然语言主要是口语和书面语。除此之外,还有手势、表情等方式可以在人与人面对面的交流中辅助传递信息。而手语则是聋人之间主要的表达方式。手语识别不仅可以为聋人提供帮助,而且也可推动人机交互研究的发展。本文主要对基于视觉的手语识别领域中的两大模块进行了应用研究:手部区域跟踪与手势特征提取。本文主要的研究工作可以概括为以下三点:(1)目标模板构建。首先对视频第一帧图像进行颜色空间的转换,然后通过肤色检测来自动截取感兴趣区域,从而得到肤色模板图,并建立其H分量直方图。这样便解决了连续自适应均值漂移(CamShift)算法的半自动化问题,为后续的手部区域跟踪打好了基础。(2)手部区域跟踪。主要研究了连续自适应均值漂移(CamShift)算法在手语视频环境下的特殊应用,实现了对手语视频中手部区域的连续跟踪。在保留CamShift算法优点的基础上,对其进行应用改进,使之能够有效地对视频中的手部区域进行自动跟踪。实验结果证明了方法的有效性。(3)手势特征提取。主要做了手势特征的提取与分析和手势特征的训练识别工作。分别提取了手部区域的椭圆拟合特征与感兴趣区域的边缘方向直方图特征。用椭圆拟合特征作为手部的位置面积方向特征,用边缘方向直方图特征作为手部的形状特征。最后利用隐马尔可夫模型(HMM)技术对提取的特征进行训练识别,在选定的手语词集中,识别率为69.6%;若将手势相近、表情不同的手势词看作一个手势词,识别率可以达到81.5%。
其他文献
RFID是Radio Frequency Identification的英文缩写,其中文名称是射频识别技术,它是应用无线电波自动识别单个物品的技术总称。在物联网中,启动RFID系统后,首先发出读取请求命
1995年,Cortes和Vapnik首先提出了支持向量机(SVM)理论,它是结构风险化准则的具体实现,且具有结构简单、全局最优以及泛化能力强的优点,特别是在解决小样本、非线性和高维模
为了实现运用机械臂的计算机书法创作模拟,本文首先介绍了计算机创作的符合隶书风格的书法字作品。然后,对创作出书法作品的骨架和笔划进行参数化,为进行机械臂书写提供控制
当今,各行各业都在使用不同样式的软件,这些软件的种类、规模以及复杂度都在一定的程度上不断地增大,这直接导致了软件发生错误的概率增大,软件出现的错误可能引发巨大的损失,有时
维基百科条目解释页面的内部链接将维基百科中的一个个条目有机联系起来,使得维基百科中的知识不再是无结构的独立页面,也使得读者无需重新在维基百科中检索即可方便地浏览与当
随着网络的普及和便携式移动存储设备的大量使用,加上计算机的开放性、易用性和标准化等特点,使计算机信息具有共享和易于扩散的特性,导致计算机信息始终面临着泄露、窃取、
随着企业级应用系统的不断发展、数量不断增多,软件复杂性急剧增加,异构和集成成为是企业级应用面临的两大主要问题。企业级系统建设既要考虑异构系统交互过程中形成的“信息
随着互联网时代的到来,网页上的二维视觉效果已经无法满足用户的要求,更多的用户希望在浏览网页时能够浏览交互式、三维动态式的页面;VRML(虚拟现实建模语言)的出现解决了这一
上个世纪以来,医学成像技术从原来的静态信息发展到动态信息,从原来的形态信息发展到包含了人体的功能信息,从平面成像发展到立体成像。医学成像技术这样的发展过程也促进了
现实世界所包含的知识的内容、结构、存在形式,某些术语的含义等等都在不断地发生变化,而这些变化很显然在建立本体时是无法预见的。这样,原本体与变化本体之间的数据就可能