论文部分内容阅读
随着多模式人机交互技术的发展,手语识别的研究也得到了越来越多的重视。然而传统的、基于计算机视觉的手语识别技术很难实时捕获手的姿势和位置。2010年11月微软推出Kinect作为Xbox360游戏主机的游戏“手柄”。Kinect凭借其能够获得人体深度图像,轻松进行人体主要骨骼关节点和手的三维特征的跟踪和分割等优势,在人机交互领域得到广泛的应用。本文基于Kinect平台,利用Kinect能够同时获取人体主要骨骼关节点和手的三维特征等优势,对中国手语识别方法进行了研究,重点研究了手语基元提取方法和利用手语基元进行手语识别的方法。主要研究内容包括:
⑴提出了基于不同的聚类方法的手语基元提取方法。该方法采用聚类分析方法,将手语特征中的相同或者相似部分进行聚合形成基元。根据Kinect获得手语的手型、位置和方向特征的不同,分别采用DBSCAN和K-means聚类算法提取位置基元和方向基元,并提出一种结合CLTree和Attribute bagging聚类集成算法提取手型基元。实验证明本文提出的手语基元提取方法是有效的、可行的。
⑵提出基于形状匹配算法(Shape Context)和高斯混合模型(GMM,Gaussian Mixture Model)的中国手语识别方法。该方法通过采用Shape Context算法计算待测手型特征与手型基元的匹配度来识别待测手型。然后利用lineardiscriminant classifier(LDC)对位置基元和方向基元进行训练,构成位置分类器和方向分类器,再以位置分类器和方向分类器为基础建立GMM模型来识别待测手语的位置和方向。最后通过集成手型、位置和方向的识别结果来识别中国手语。实验结果表明该方法不仅能够接近精密仪器的识别水平,而且具有非侵入式的优点和较高的实时性。
⑶设计并实现了一个基于Kinect的中国手语识别原型系统。该系统能从Kinect采集人体主要骨骼的3D坐标和手的3D坐标,提取手语特征和手语基元,最后对手语进行识别并给出响应。经实际测试,该系统能在不同背景、光照、服装和性别等条件下很好的识别中国手语。