基于深度视频的3D人体行为识别算法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:weishenmeme11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别作为近几年来备受关注的一个研究方向,越来越多的研究人员致力于该方向的研究。然而,人体行为识别并不是一个简单的任务,人行为的多样性以及光照、遮挡等环境因素都增加了该研究方向的困难程度。随着21世纪的到来,人类的科技水平和生产能力都取得了极速的飞跃,尤其是计算机技术、传感器、多媒体等领域都发生了翻天覆地的变化。行为识别常用的RGB摄像头、深度摄像头、范围传感器、可穿戴加速度传感器等硬件设备的出现也使得行为识别这项技术逐渐变成现实。由于深度摄像头所展现出来的优越性,本文针对基于深度数据的人体行为识别算法展开研究。本文的主要创新点如下:(1)传统的深度动作图(Depth Motion Map,简称DMM)将整个动作序列压缩到一张二维图像上,损失了大量的时间信息。于是,本文提出了一种基于模糊分片的特征提取算法。该算法首先将深度动作图的提取方式改进为分片的模式,同时受到HOG特征提取算法的启发,即各个区块中可以采用重叠(overlap)的方式来防止某一个连续区域被分割的思想,本文又进一步对视频序列的划分采用模糊分片的策略,各个分片之间不存在特定的边界,相邻分片中的视频帧可以共享。这使得本文的算法能够保存连续的时间信息,计算得到的特征具有更好的说服力。(2)针对模糊分片之间能量不均匀的问题,本文又进一步提出了一种基于动作能量(motion energy)的模糊分片方法。该方法借鉴了前文的分片策略,但两者最大的区别在于之前的分片策略基于具体视频帧,而本方法则根据帧之间的能量来进行分片,分片后的序列能量更为均匀。因此,这样得到的模糊边界子序列具有自适应的能力,它能根据不同的能量分布来自动划分序列,本文称这种模糊边界子序列为自适应模糊边界子序列。(3)基于动作能量的模糊分片方法虽然有着不错的表现,但是在这种单尺度分片策略中目标对象的运动速度等细节差异依然会丢失,尤其是复杂动作。为了解决这个问题,本文提出了一种基于自适应模糊边界子序列的人体行为识别方法。该算法首先提取自适应模糊边界子序列,然后采用多时间尺度深度动作图(Multi-temporal DMM)来捕获速度等细节信息,接着使用LBP特征和Fisher向量来描述这些深度动作图,得到最终的特征向量。针对行为识别中小样本问题,本文使用了鲁棒的概率协作表示分类器(RProCRC)。实验结果表明,本文提出的基于模糊分片的多时间尺度深度动作图算法在多个常见的公开数据集上取得了较高的识别率。
其他文献
摘要:站在人工智能角度,从局部化信念修正和Horn信念修正这两个目前的热点,阐述信念修正理论的新世纪研究动态。  关键词:人工智能;信念;修正  中图分类号:TP18 文献标识码:A 文章编号:1007-9599 (2012) 15-0000-02  众所周知,人或智能体的信念随着新信念的获取而不断发生变化。当人或智能体获得新信念时,新获取的信念可能与原有信念产生矛盾。通常认为新获取的信念是
根据网管和水泵的运行特性曲线,阐明了高层供水系统的变频调速节能原理。本次设计主要以高层供水系统为控制对象,采用PLC和变频技术相结合的技术,设计一整套的高层恒压供水系统,
摘要:FLOSS(Free/Libre and Open Source Software)又叫做自由/开源软件,它被证实为当今最好的开放、合作、国际化产品和开发样例之一,已经为全世界各大机构,包括政府、政策、商业、学术研究和开源领域带来巨大的利益。本文将讨论应用开源软件进行计算机取证的优势,探讨开源的、非商业性的取证软件在某些方面更加适合进行计算机取证的原因。  关键词:计算机取证;开源软件  中
本文概述了近年计算机网络安全的现状,并分析了计算机网络面临的一些安全问题,最后对计算机网络安全的应对策略进行了探讨。
基于Laguerre函数展开的时、频同时外推法,分析计算了在高斯型平面波激励下多散射体的电磁响应.这种方法的核心思想是:预先由时域和频域方法分别得到早时响应和低频响应,然后
建立利用原子吸收鉴别中药材贝母的方法。利用原子吸收分光光度器和定碳定硫器对10种产地贝母中的16种微量元素进行了测定。测定出贝母中16种微量元素的含量,并以测定结果含量