基于骨架信息的人体动作识别

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:david_test
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别是计算机视觉领域一大热门的研究方向。其主要目的是对视频中的人体动作进行正确地分类。这项技术可以被应用到智能视频监控、人机自然交互、运动视频分析以及无人驾驶等领域。然而如何构造有效的特征来对视频当中的人体动作进行描述一直是一个非常有挑战性的问题。本文通过对人体骨架信息进行深入挖掘,提出了基于关节点位置的动力学和关系特征,这组特征由4大类特征、36种子特征构成。1.关节动力学特征:这一大类特征由速度、加速度、角速度、角加速度、速率、加速率、动能、动能变化、重力势能、重力势能变化、总能量、总能量变化、归一化位置等13种子特征构成,这组特征从关节点运动和能量变化的角度出发,充分地挖掘了人体骨架的动力学信息。2.相关关系特征:这一大类特征由速度相关关系、加速度相关关系、角速度相关关系、角加速度相关关系,能量变化相关关系等5种子特征构成,这组特征描述了任意一对关节点之间的运动相关关系和能量变化相关关系。3.距离关系特征:这一大类特征由水平距离关系及其轨迹、垂直距离关系及其轨迹、方向正弦距离关系及其轨迹、方向余弦距离关系及其轨迹、特征向量方向距离关系及其轨迹、连通距离关系及其轨迹等12种子特征构成,这组特征描述了任意一对关节点在特定方向上的距离关系。4.几何关系特征:这一大类特征由关节向量内积及其轨迹、关节向量余弦相关性及其轨迹、关节三角形面积周长比及其轨迹等6种子特征构成构成,这组特征描述了任意三个关节点之间几何关系。将这些特征合并在一起构成基于关节点位置的动力学和关系特征。本文对这组特征的各个子特征进行了全面的比较。这组特征在JHMDB数据集、sub-JHMDB数据集和Penn Action数据集上均取得了不错的效果。此外,由于动作识别系统中每个环节都会对最后的识别结果产生一定的影响,因此本文探索了适合基于关节点位置的动力学和关系特征的动作识别算法框架。其中最合适的词袋模型为基于K均值聚类和向量量化的词袋模型,最有效的分类模型为多通道的RBF-χ2核的支持向量机。总而言之,通过充分挖掘骨架信息,本文提出了一组基于关节点位置的动力学和相关关系特征,并探索了适合这一特征的词袋模型和分类模型。通过充分的实验验证了这组特征的有效性,也为下一步利用基于骨架信息对人体动作进行识别的研究工作提供了建议。
其他文献
近年来,多媒体技术和嵌入式芯片发展迅速,基于嵌入式系统的多媒体应用越来越多,而当今社会人们越来越依赖于从网络上获取信息,基于嵌入式系统与网络相结合的多媒体应用逐渐被
随着认知无线电技术的发展,频谱动态接入已日益走向现实,给解决频谱紧张问题提供了新的研究方向。认知无线电的基本思想是认知用户通过频谱感知检测到周围无线通信环境中未被
随着科技的飞速发展以及人们生活水平的提高,安全防范意识逐渐深入人心。在安全防范领域中,视频监控发挥着举足轻重的作用。近十几年来,视频监控网络逐渐分布到公共场合的各
随着通信事业的飞快发展,通信基站动力与环境的监控越来越重要。基站集中监控系统是利用现代高质量的通信设备和计算机设备对动力和环境量进行实时高效监控的系统,该系统对分散
车载信息系统是将车身的各种信息进行采集、处理、通信、显示及存储的信息控制系统,是多种技术应用于汽车行业的产物。随着科技的进步,各类技术不断发展成熟并逐步的投入,汽
PCM/FM(脉冲编码调制/调频)信号是CPM(连续相位调制)信号中的一种类型,被普遍应用于军事卫星和航天遥测标准IRIG-106。本文主要的研究内容是频率调制系统和解调系统。   目
TD-LTE系统下行链路采用的多天线技术包括:发射分集、空分复用、波束赋形;在实际应用中,系统会根据不同的场景实现该三种模式的自适应切换。其中基于用户参考信号的波束赋形技术