论文部分内容阅读
在交互式系统中一个重要的环节就是人与计算机之间的交互。交互方式是否自然真实、计算机响应是否准确、计算机响应是否实时等等因素决定了人与计算机之间交互的成功与否。人体动作识别作为现今人机交互领域的一个重要分支,已经成为了一个研究热点。动作识别主要需要考虑两个方面,一个方面是识别的准确度,识别系统需要能够在用户做出已经定义的动作时候,输出正确的识别结果。另一方面是识别的实时性,识别系统需要在用户做出动作的较短时间内,识别出用户的动作。本文针对自然人机交互系统中实时人体动作识别的问题展开研究,提出了一套包括了分类器训练、实时识别和识别优化的整体系统框架,该框架描述了整个从特征提取到强分类器获取的训练模块,从实时动作输入到候选动作输出的实时识别模块和最后基于隐马尔可夫模型的识别优化过程。该框架能够解耦合训练模块和识别模块。论文的主要工作和研究成果包括:(1)本文提出了一种以肢体节点的灵活性为依据的人体骨骼模型分层方法,在高精度、高频率、高可靠性的人体数据源的情况下,构建以肢体节点的灵活性为分层依据的五层人体骨骼模型,该多层的人体骨骼模型能够直观的反应人物的动作变化,也能够适用于提取人体特征。(2)在骨骼分层的基础上提取出了一套四元组、相对父节点四元组及其对称四元组的曲线特征集提取特征方法。通过分析人体特征提取的难点,指出在提取特征的时候需要考虑到,对于不同身高、体型的用户的不变性和对于不同动作的普适性。采用了基于多层人体骨骼模型的四元组、相对父节点四元组及其对称四元组在时间上的曲线作为特征集能够解决上述难点。最后,通过迭代的Adaboost方法进行强分类器的提取,该强分类器将会用于之后的实时动作识别。(3)提出了一种改进的动态时间规整算法,较大地降低了动作节奏走样的错误,在实时识别的距离计算中,因为添加了时间偏移的限制,所以该方法比普通的动态时间规整算法更好的适用于连续动作识别。(4)提出了一种自顶向下以弱分类器权重降序的金字塔型匹配方法,在保证不降低识别准确度的情况下,大量地减少了在实时识别过程中特征提取和距离计算的计算量。(5)本文提出在候选动作序列层面上、基于隐马尔可夫模型的识别优化方法,解决了互有一部分重叠或相似性的动作之间的区分识别,该算法是在之前的独立识别的方法上,对于候选动作序列添加了时序上的限制,能够自适应地解决上述问题。本文对于提出的方法都通过一系列的实验及数据分析,分别验证了本文的识别方法和系统在识别准确度上及时间效率上的优势。所得到的结果能够证明本文所提出的方法是可以有效地、高效地进行动作识别。