基于Kinect的中国手语识别方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:nimakule119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多模式人机交互技术的发展,手语识别的研究也得到了越来越多的重视。然而传统的、基于计算机视觉的手语识别技术很难实时捕获手的姿势和位置。2010年11月微软推出Kinect作为Xbox360游戏主机的游戏“手柄”。Kinect凭借其能够获得人体深度图像,轻松进行人体主要骨骼关节点和手的三维特征的跟踪和分割等优势,在人机交互领域得到广泛的应用。本文基于Kinect平台,利用Kinect能够同时获取人体主要骨骼关节点和手的三维特征等优势,对中国手语识别方法进行了研究,重点研究了手语基元提取方法和利用手语基元进行手语识别的方法。主要研究内容包括:   ⑴提出了基于不同的聚类方法的手语基元提取方法。该方法采用聚类分析方法,将手语特征中的相同或者相似部分进行聚合形成基元。根据Kinect获得手语的手型、位置和方向特征的不同,分别采用DBSCAN和K-means聚类算法提取位置基元和方向基元,并提出一种结合CLTree和Attribute bagging聚类集成算法提取手型基元。实验证明本文提出的手语基元提取方法是有效的、可行的。   ⑵提出基于形状匹配算法(Shape Context)和高斯混合模型(GMM,Gaussian Mixture Model)的中国手语识别方法。该方法通过采用Shape Context算法计算待测手型特征与手型基元的匹配度来识别待测手型。然后利用lineardiscriminant classifier(LDC)对位置基元和方向基元进行训练,构成位置分类器和方向分类器,再以位置分类器和方向分类器为基础建立GMM模型来识别待测手语的位置和方向。最后通过集成手型、位置和方向的识别结果来识别中国手语。实验结果表明该方法不仅能够接近精密仪器的识别水平,而且具有非侵入式的优点和较高的实时性。   ⑶设计并实现了一个基于Kinect的中国手语识别原型系统。该系统能从Kinect采集人体主要骨骼的3D坐标和手的3D坐标,提取手语特征和手语基元,最后对手语进行识别并给出响应。经实际测试,该系统能在不同背景、光照、服装和性别等条件下很好的识别中国手语。
其他文献
基于偏微分方程(Partial Differential Equations,简称PDE)的图像处理是一个非常富有挑战性的新兴领域,因为这一领域具有很多传统方法无法具备的优势,所以已经引起了许多国内
无线传感器网络的不断发展,推动了新兴的无线业务。在无线业务的发展中事物的位置信息备受关注,尽管基于卫星通信的全球定位系统能有效的解决大量军事及民用的定位问题,但仅局限
随着因特网中各个网络节点上图像数据的急剧增加,图像的种类愈加繁复,每一种类的图像也愈加丰富,这给人们带来了很多便利,但也给海量图像资源的检索带来了很大负担,如何有效
随着空间数据库的广泛应用和计算资源的不断开发,人们对基于位置服务LBS(location-based Services)的期望也越来越高,这意味着LBS必须能处理更复杂的查询。最近邻NN(nearest
由于有线通信方式对应用范围的限制,人们发明了无线移动通信。近年来,无线网络在支持移动性方面的发展非常迅速,再加上交通领域信息化的迫切需求,车载自组织网络VANET应运而
车辆自主驾驶技术在经济、军事、科技等方面具有重要的价值,但在真实交通环境下,智能驾驶研究面临安全、法律等问题。缩微智能车的实验环境相对封闭,缩微智能车的研究不存在安全
片上多核处理器(Chip Multi-Processor, CMP)已经成为高性能微处理器的发展潮流。高速缓存作为处理器与主存之间的重要桥梁,在计算机系统的性能优化中发挥着重要作用。一种能
在计算机图形学中,三维模型通常使用三维网格表现。网格模型凭借着其直观、生动的表现形式,广泛应用于游戏开发、影视制作、工业制造和旅游景观等领域。然而,较大的网格模型受到
云计算的大规模发展以及云服务在终端的按需供给,使得人们越来越多的感受到云计算提供的便利。伴随着环境的动态化、服务的多样化和用户需求的个性化,云环境下的服务选择问题日