论文部分内容阅读
随着虚拟现实技术(virtual reality,VR)的发展,其交互技术已成为研究及使用者关注的焦点。如今的虚拟现实产品更注重的是在头戴显示器中视觉效果的展示,而对交互手段或多或少有些忽视。如今的交互主要是借助某些或传统或特定的电子设备来进行交互,如鼠标、键盘、手柄等,虽然暂时解决了交互问题,但是也带来了一些问题。一是使用户从虚拟世界中抽出,沉浸度大大降低;二是对某些特定电子设备依赖度较强,带来较高的金钱与学习上的成本。在这种条件下,手势交互的优点便显现出来了。对于人来说,使用手势动作进行交互是本能,可以有效减小学习成本并增加沉浸感,而手势交互更多的依赖计算机视觉与计算机图形学等技术,对于特定电子设备不会过度依赖,从这一点看使用手势交互控制了金钱上的成本。因此,对于虚拟现实来说,手势交互具有重要的研究价值。本文主要研究的是基于一个特定VR头显——HTC Vive,进行兼顾沉浸感、准确率和实时性三者的手势交互。主要工作包括以下几点。提出一种将手部图像与虚拟现实融合的方法。为了提高沉浸感并降低对特定电子设备如手柄、手套的依赖,使用单目摄像头采集的视频信息作为输入数据,对其进行预处理。在这一步骤中对比分析几种常见的肤色分割方法,并对自适应阈值分割的方法进行了改进,来适应本文应用场景,并用此方法将手部图像从复杂背景中分割出来,与虚拟环境进行融合。提出一种在沉浸式VR中进行手势识别的方法。由于第一人称手势数据集较少,首先建立用于本实验的数据集,通过使用现有开源数据集和笔者采集数据进行结合来构建。由于第一人称手势在方向上变化并不明显,因此选用近年来在行人检测中应用较为广泛的方向梯度直方图(histograms of oriented gradient,HOG)用于提取手势特征,应用支持向量机(Support Vector Machine,SVM)方法实现手势的分类与识别,对训练时数据集大小进行分析并选择。最后与Hu矩提取特征的方法和Zernike矩方法进行对比分析,说明了本文方法在准确率上的优势,同时也能够满足实时性要求。搭建VR手势交互示例平台,在HTC Vive中进行手势交互。实验证明,该方法可以满足准确率与实时性的要求。