论文部分内容阅读
随着人机交互技术的不断发展,动态手势识别以自然便捷的交互体验,逐渐获得了用户的认可,在虚拟现实、增强现实等新型多媒体技术应用中展现出广阔的前景。基于视觉的动态手势识别技术以自然便捷的优势,逐渐成为手势识别技术发展的趋势。深度信息的引入进一步克服了彩色信息受环境光照变化、背景复杂性影响的缺陷,并将丰富的空间三维信息融入到手势特征中,这有助于提高手势识别算法的性能。然而,目前基于深度信息的动态手势识别算法对动态手势的运动特性分析不够充分,一方面导致了提取的手势特征存在时域冗余信息,另一方面算法对运动速度有差异的手势鲁棒性较低。本文针对以上问题展开了研究。 首先,提出了基于深度图序列的手势分解算法。该算法首先提取深度图基于方向的手势形状特征,该特征可以刻画手部边缘的方向信息。接着提出了基于谱聚类算法的深度图序列手势分解算法,利用聚类方法解决手势分解问题。求相邻帧的加权相似性矩阵,建立无向图模型。为解决图划分问题,将相似性矩阵转换为拉普拉斯矩阵求解该矩阵的特征向量,将图优化问题简化为矩阵求解问题。进一步选取特征向量并对其进行二分迭代聚类,解决了手势分解过程中无法确认子序列数目的问题。从每个类别中选取最具代表性的手势节点组成关键点集合,实现了手势的分解。 然后,提出了基于手势分解的动态手势识别算法,并针对自定义数据集和公共数据集详细分析了算法中参数的影响,进行了对比实验分析。结果表明本文提出的基于手势分解的动态手势识别算法解决了动态手势识别中手势特征存在时域冗余信息以及特征对手势速度变化鲁棒性低的问题,显著提高了手势识别率。 最后,本文将基于深度信息的动态手势识别算法转换为立体场景交互的关键技术,实现了基于动态手势识别的3D虚拟会议场景交互系统。将动态手势识别与立体显示技术相结合,实现了理论研究向实际应用的转化。