论文部分内容阅读
随着计算机的普及和投影仪的广泛使用,投影环境下的人机交互方式成为新的研究热点。与传统的交互方式如键盘、鼠标相比,直接用手作为输入自然、简洁、直接且表意丰富。在投影环境下,使用基于视觉的手势交互方式还具有成本低廉、部署方便的优点。基于视觉的手势交互利用摄像头对手势进行非接触式的捕获,是一种自然的交互方式。但是,基于视觉的方法容易受到背景变化、环境光照变化等影响。在投影环境下,如果使用基于可见光成像方法,投影光会造成背景复杂,手势表观也会受其严重影响,对手势图像的分析非常复杂,很难保证交互系统的实时性。而在近红外视觉条件下,由于投影仪与近红外图像采集设备工作在不同的光波长范围,因此投影光对手势成像没有直接影响,并且背景也相对比较简单,对手势图像的分析难度不大,有望实现投影环境下基于视觉的实时人机交互。本文首先对摄像机-投影仪交互系统进行了模块化分析,然后完成了基于近红外视觉的摄像机-投影仪交互系统的硬件设计,并对基于近红外视觉的手势交互系统所涉及的基于视觉的运动目标检测算法和手势分析算法进行了探索。本文的研究成果如下:1.摄像机-投影仪交互系统的模块化设计。提出了将摄像机-投影仪交互系统分成图像采集模块、几何标定模块、手势区域提取模块、手势分析模块、手势轨迹识别模块、交互界面接口模块六大模块的设计,并对各个模块的功能及模块之间的协调方式进行了定义。2.摄像机-投影仪交互系统的硬件设计。通过对几种图像采集设备获取的图像特性进行分析,确定了使用基于近红外视觉方法的实验方案。提出了一种将主动式采集和被动式采集结合起来的图像采集设备设计方案,并设计制作了阵列式近红外光源。3.基于自适应更新窗口的运动目标检测算法。通过对常用运动目标提取算法的理解,结合摄像机-投影仪交互系统中手势运动的特殊性,提出了一种基于自适应更新窗口的运动目标检测算法,实现了在近红外视觉下对运动手势的快速分割。4.基于手势形状表示的改进型Neural Gas算法。探索了基于自组织特征映射的神经网络算法在手势拓扑网络结构表示中的应用,根据手势形状的特殊性对算法进行了改进,并优化了计算过程,实现了对分割出的手势二值图像快速生成手势的拓扑网络结构表示。