论文部分内容阅读
人体动作识别是计算机视觉领域一大热门的研究方向。其主要目的是对视频中的人体动作进行正确地分类。这项技术可以被应用到智能视频监控、人机自然交互、运动视频分析以及无人驾驶等领域。然而如何构造有效的特征来对视频当中的人体动作进行描述一直是一个非常有挑战性的问题。本文通过对人体骨架信息进行深入挖掘,提出了基于关节点位置的动力学和关系特征,这组特征由4大类特征、36种子特征构成。1.关节动力学特征:这一大类特征由速度、加速度、角速度、角加速度、速率、加速率、动能、动能变化、重力势能、重力势能变化、总能量、总能量变化、归一化位置等13种子特征构成,这组特征从关节点运动和能量变化的角度出发,充分地挖掘了人体骨架的动力学信息。2.相关关系特征:这一大类特征由速度相关关系、加速度相关关系、角速度相关关系、角加速度相关关系,能量变化相关关系等5种子特征构成,这组特征描述了任意一对关节点之间的运动相关关系和能量变化相关关系。3.距离关系特征:这一大类特征由水平距离关系及其轨迹、垂直距离关系及其轨迹、方向正弦距离关系及其轨迹、方向余弦距离关系及其轨迹、特征向量方向距离关系及其轨迹、连通距离关系及其轨迹等12种子特征构成,这组特征描述了任意一对关节点在特定方向上的距离关系。4.几何关系特征:这一大类特征由关节向量内积及其轨迹、关节向量余弦相关性及其轨迹、关节三角形面积周长比及其轨迹等6种子特征构成构成,这组特征描述了任意三个关节点之间几何关系。将这些特征合并在一起构成基于关节点位置的动力学和关系特征。本文对这组特征的各个子特征进行了全面的比较。这组特征在JHMDB数据集、sub-JHMDB数据集和Penn Action数据集上均取得了不错的效果。此外,由于动作识别系统中每个环节都会对最后的识别结果产生一定的影响,因此本文探索了适合基于关节点位置的动力学和关系特征的动作识别算法框架。其中最合适的词袋模型为基于K均值聚类和向量量化的词袋模型,最有效的分类模型为多通道的RBF-χ2核的支持向量机。总而言之,通过充分挖掘骨架信息,本文提出了一组基于关节点位置的动力学和相关关系特征,并探索了适合这一特征的词袋模型和分类模型。通过充分的实验验证了这组特征的有效性,也为下一步利用基于骨架信息对人体动作进行识别的研究工作提供了建议。