论文部分内容阅读
基于视觉的手势识别是人机交互领域的一个重要研究课题。人与计算机交互时使用自然手势来替代中间媒介,这种交互方式自然、直观,更贴近人类的交流习惯,其应用前景也非常广泛。如何从连续的手势序列中分割出系统预定义的操作手势是手势识别研究的重点和难点。目前对动态手势识别的研究存在两大难点:一是手势在时空上的差异性,即同一个用户重复做同一种手势或不同用户做同一种手势时,由于手的形状、运动速率及幅度各不相同,造成手势在轨迹和持续时间上有很大差异;二是对连续手势的自动切分问题,由于连续手势序列包含典型手势和非典型手势,需要准确地定位其中典型手势的起始点和终止点,对连续手势进行自动切分并规避手势交互的回程、过渡手势等问题。为解决这些问题,本文针对隐马尔可夫模型(HMM)进行研究,因为HMM能够在时空变化的条件下分析时间序列,有很强的描述手势信号变化的能力,并且能够拒识非典型手势。本文在现有的动态手势识别算法的基础上,主要做了如下三部分的工作:首先,本文研究基于隐马尔可夫模型(HMM)的孤立手势序列的识别,并对训练方法进行改进,针对误识样本进行二次训练,提高了识别率;针对典型模型无法拒识非典型序列的问题,本文提出了一种基于训练样本提取阈值的方法,本文算法对典型手势识别率达到98.06%,对非典型手势拒识率达到91.25%。其次,针对动态手势在线识别时对自适应阈值的需求,本文研究了基于阈值模型的手势识别算法,对典型手势识别率达到97.87%,对非典型手势拒识率达到93.75%,并分析了阈值模型在连续手势序列识别中的优缺点。最后,本文提出拐点检测法用于检测手势序列中可能的起始点与终止点,并根据拐点分割出候选手势序列;结合孤立手势识别,实现动态手势在线切分与识别的算法框架;为了解决完整序列分割与嵌入式手势的识别问题,本文修改以上识别框架,在检测到典型手势时,不直接输出,而是执行终止点检测,若为嵌入式手势还需递归检测长手势序列,以确保输出时是完整序列。