论文部分内容阅读
随着信息技术的飞速发展,能够满足人机自然友好交互需求的新型人机交互技术得到了人们越来越广泛的关注。手势是人们日常生活中的一种交流手段,基于计算机视觉的手势识别技术使得计算机能够“看懂”人的行为和动作,能够给用户带来更自然、直观的交互体验,是新型人机交互技术发展中的一个重要方向。本文从智能控制与人机交互的角度出发,研究了基于视觉的手势识别的相关算法。论文从手势分割、指尖检测和手势的特征提取与识别等方面进行了研究。论文的具体研究工作主要有以下几点:1.针对现有手势分割方法不准确、适应性差等问题,提出一种基于区域增长型脉冲耦合神经网络的手势分割方法。该方法首先在YCgCr颜色空间建立高斯肤色模型,在此基础上以较苛刻的原则(能够保证所选像素为肤色像素)选取肤色区域作为种子区域。然后,在高斯肤色相似度图像上,采用基于脉冲耦合神经网络机制的区域生长算法来提取肤色区域。最后,根据肤色区域的几何特征提取手势区域。实验表明:该算法能够有效的克服光照变化的影响,在不同的光照环境下都能够得到较好的肤色检测效果。同时,分割结果中肤色区域具有边缘平滑的特点,这将非常有利于手势识别的后续处理。2.在手势分割的基础上,提出了一种基于多尺度曲率分析的指尖检测算法。该算法首先采用8-邻域轮廓跟踪算法提取手势轮廓;其次,针对手势轮廓的周长设定轮廓搜索尺度区间,在此尺度区间内进行手势轮廓的多尺度曲率计算以定位指尖。实验表明:该算法具有较好的指尖检测效果,具有手势旋转、缩放不变性,并能够满足系统实时性要求。3.针对类肤色信息或复杂背景的影响,难以通过手势分割得到精确手势轮廓而对后期手势识别率与实时交互的影响,基于图像局部不变性特征理论提出一种基于特征包及支持向量机的手势识别模型。采用SIFT算法提取手势图像局部不变性特征点,将手势局部特征向量(SIFT描述子)进行K-means聚类生成视觉码书,并通过视觉码书量化每一幅手势图像的视觉码字集合,以此获得手势图像的固定维数的表征向量来训练SVM多类分类器。该方法只需框定手势所在区域,无需精确地分割人手。实验中针对9种交互型手势获得了较高的识别率。实验表明该方法具有很好的鲁棒性及实时性,能适应环境的变化。4.结合研究目标及应用需求,分析应用场景,在VC++6.0环境下基于OpenCV视觉库设计实现了一个基于指尖检测的PowerPoint手势控制系统。系统通过指尖检测技术,以指尖数目及相对位置信息来判别手势,替代鼠标和键盘控制PowerPoint的放映。该系统应用在教师授课的场景中,能够提高教师授课的方便性,丰富授课乐趣。