论文部分内容阅读
随着计算机技术的发展,手势识别已经成为了人机交互领域的重点研究方向。近年来,基于视觉的手势识别技术突飞猛进,其中基于Kinect设备的手势识别发展尤为迅速。Kinect设备可同时获得图像的彩色、深度图像以及骨骼坐标信息,为手势识别提供了便捷,可有效减少复杂背景和光照变化、肤色差异等对识别结果造成的误差。针对实际应用中对手势识别算法的鲁棒性、精准性和实时性需求,本文分别从传统方法的手势识别和深度学习算法等两方面展开研究,主要贡献如下:(1)提出一种基于超像素的手势识别算法:首先利用SLIC算法获得手部区域的超像素表示,然后进行超像素的规范化和有序化处理,最后采用动态规整算法实现不同手势的识别。实验结果表明,该方法能够在复杂背景、肤色干扰等变化条件下获得较高的识别率和计算效率,具有很好的抗干扰性和稳定性。(2)探讨了基于深度图像的手势识别算法:首先利用图像处理技术从深度图像中提取手部区域的轮廓点、指尖点和掌心点等信息,接着求解改进的Hu矩特征使之具有平移、旋转不变性和尺度不变性等特性,最后结合手指区域的共线性以及手指间角度等信息实现数字手势的识别工作,在此基础上开发了一套在线手势识别系统。运行结果表明,该算法可在复杂背景、肤色干扰等变化条件下快速准确的识别各种数字手势,且具有很高的鲁棒性和识别精度。(3)研究了嵌入SENet的改进神经网络方法:卷积神经网络可解决传统手势识别方法人工抽取特征过程繁琐、计算复杂等问题。本文在原有的网络框架基础上,为了进一步提升网络性能,解决过拟合、识别精度低等问题,引入SENet网络模块重新构建了一个新的网络模型。并在自建数据及和标准数据集上进行测试。实验结果表明,改进模型的识别精度得到了有效提高,取得了不错的手势分类效果。