基于三维骨架的时空表示与人体行为识别

来源 :西安电子科技大学 | 被引量 : 9次 | 上传用户：liangjielin

【摘要】

：

人体行为识别是计算机视觉和多媒体分析领域一个非常活跃的研究主题,其涉及到图像处理、模式识别和人工智能等多门学科,在诸如消费者的互动娱乐和游戏、视频监控、生活照顾系

【作者】

：

丁文文

【出处】

：

西安电子科技大学

【发表日期】

：

2017年01期

【关键词】

：

三维骨架深度图像人体行为识别动作分割隐马尔科夫模型自组织映射张量线性动态系统格拉斯曼流形

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

人体行为识别是计算机视觉和多媒体分析领域一个非常活跃的研究主题,其涉及到图像处理、模式识别和人工智能等多门学科,在诸如消费者的互动娱乐和游戏、视频监控、生活照顾系统、视频检索和异常行为检测等领域展现出极其广泛的应用前景。行为识别的主要挑战在于数据获取的精确度和整个动作序列的动态建模,影响行为识别率的主要因素可以分为四类:1)遮挡、阴影、光照条件等;2)视角变化;3)尺度的变化;4)类内变异与类间相似性。近年来,随着3D深度摄像机的发布,比如微软公司的Kinect,可以提供场景的三维深度数据变化的画面,显著改善了行为识别的前三类问题,但对于第四类问题依然具有很大的挑战性。此外,3D深度摄像机还提供了骨骼追踪技术,可以从深度数据中确定人体各个关节点的位置坐标,从而构成人体三维骨架。论文从人体三维骨架序列出发,首先提出了时空特征链和双链的序列谱隐马尔科夫模型来解决了特征序列匹配时存在的时间动态性问题,随后建立基于自组织映射的层次时空模型,通过Hebbin学习子动作在每个动作中的重要度,进行人体行为预测;最后针对如何高效、准确地获取人体行为特征在低维流形的表示形式,对人体三维骨架序列张量化,通过扩展线性动态系统,来发现隐藏在数据中的内在几何结构与规律性,并在多个具有代表性的行为数据库上验证了论文提出方法的有效性。具体而言,本文的主要贡献和创新点主要包括下四点:1.针对三维骨架序列长度不一致和存在重复子动作问题,提出时空特征链模型。获得时空特征链主要通过三个步骤:第一,通过3D关节点位置的变化来绘制人体行动轨迹,并利用关节点轨迹的速度、曲率和朝向生成动作的分割点,把动作分割为多个富有意义的子动作。这些新获得的分割点能确定动作的开始帧和结束帧,并在一定程度上消除噪声。第二,构造子动作图,建立关节点位置和运动的关系。从子动作图中挖掘出动作中的周期序列,获得动作的非周期序列。最后,对动作的非周期序列对齐,获得时空特征链。2.针对时空对准问题,提出了双链序列谱隐马尔科夫模型。通过使用动作分割点,获得了有意义的行动单位,使得一个动作由瞬时动作(人体姿态)和子动作来表示。瞬时动作对应于动作分割点,用大写字母表示。子动作对应着动作分割点之间的子动作,用小写字母表示。那么,一个动作就可以表示为大小写字母交替的字符串。为了克服同一动作不同运动风格所造成的突变或异常姿势,序列谱马尔可夫模型采用Viterbi和Baum Welch算法对这些符号序列进行对齐,完成人体行为识别。3.提出基于自组织映射的层次时空模型,根据已知动作序列来预测人体行为。层次时空模型由两个自组织映射搭建,通过Hebbian来学习动作和子动作之间的关联度大小。由于变阶马尔可夫模型提供不同长度子动作序列之间的依赖衡量度,未知的动作序列则可以通过变阶马尔可夫模型进行预测。4.在张量动作序列表示下,拓展了传统估计线性动态系统参数方法,分析了三维骨架序列的高阶张量表示的优势。线性动力系统由于其相对简单和有效,在各种学科中是最常见的时空数据编码的工具。然而,传统线性动力系统对每个视频帧是以一个列向量作为其潜在的观测状态。这样的向量表示并没有考虑到维数灾难,以及人体骨架中有价值的结构信息。鉴于此,我们提出了广义线性动态系统对动作序列建模,使用Tucker分解张量动作序列,来估计广义线性动态系统参数。通过广义线性动态系统参数构成的动作描述符,使得一个动作可以映射到一个Grassmann流形上的一点。最后,使用Grassmann流形上的字典学习和稀疏编码对人体行为进行分类,取得了明显的性能提升。

其他文献

老年人全血细胞减少81例病因分析与鉴别诊断

临床上全血细胞减少(PCP)病例较常见,老年人由于易患多种疾病,原发病与并发症常常相互交错,外周血表现三系减少,在疾病诊断时有一定难度。为了探讨老年人全血细胞减少病因特

期刊

老年人全血细胞减少骨髓增生活跃病态造血病因分析鉴别诊断

硝酸甘油联合多巴胺微泵泵入治疗难治性心力衰竭102例疗效观察

目的观察微量输液泵泵入硝酸甘油与多巴胺治疗难治性心力衰竭的效果。方法选择2011年1月至2014年1月本院的102例心功能IV级（NYHA分级法）的住院患者,在卧床休息、控制饮食、吸

期刊

难治性心力衰竭硝酸甘油多巴胺微量泵泵入

西都房地产公司发展转型研究

房地产企业只有认清国家发展趋势的大环境,依靠自身的动态能力来适应外部的动态变化,才能做到稳定持续健康发展。但若想要做到如此,就需要房地产企业对自身提出更高的要求。本文将企业发展相关理论与西都房地产公司实际情况相结合,以其作为主体研究对象,对房地产公司潜在的发展能力进行挖掘与分析,制定一系列的发展转型策略,这对房地产公司发展转型起到了很好的指引作用。在研究中,本文还结合了西安房地产当前发展转型的实际

学位

房地产企业转型发展

版图光刻工艺热点快速检测及修复技术研究

随着集成电路生产工艺进入亚波长技术节点,由于设计变得更加复杂,使用分辨率增强技术修复光刻工艺热点变得更加困难。为了解决这个问题,设计者在产品流片前必须对版图设计中

学位

可制造性设计分辨率增强技术光刻工艺友善性检查图形匹配技术版图修复技术

论装饰雕塑的材料肌理

主要阐述装饰雕塑的材质肌理的特性及其对整个造型的影响.探讨材料肌理的应用与开发.

期刊

装饰雕塑材质肌理

亚波长多层膜结构的表面电磁场特性研究

随着纳米光学的发展,表面等离激元、光学天线、超材料、超表面等新概念相继出现,人们通过对结构的新设计可实现对电磁波场的强大调控,表现出了新颖的光学性能,实现了各种新型

学位

Maxwell方程转移矩阵多层膜结构表面等离激元等效介质理论表面布洛赫波

单环刺螠内脏多糖结构的分析及其对脂质过氧化物的清除作用

为开发单环刺螠内脏中活性多糖成分,利用两步酶解法提取单环刺螠多糖,对其单糖组成、分子质量和连接方式等理化性质和结构特征进行研究,并通过体外清除脂质过氧化物实验对其

期刊

单环刺螠内脏多糖结构理化性质脂质过氧化

谈资产负债审计的难点

<正> 审计实践告诉我们,要搞好商贸企业资产负债审计,必须突出重点,抓住难点。——资产真实性审计是开展资产负债和损益审计的难点在新的形势下,审计工作重点必须是保证国有

期刊

企业存货流动资产

玉米全粉/PVA共混膜的制备及性能研究

塑料制品因使用轻便、机械强度高、防水耐用、化学性质稳定、制造成本低得到广泛使用,但由于传统塑料不易降解,由此带来的“白色污染”给生态环境带来越来越大的压力,同时传

学位

玉米全粉三乙醇胺硼砂交联剂共混膜

上下第二恒磨牙锁的矫正

上下第二恒磨牙锁是临床上常见的错牙合畸形,由于患牙处于废用状态,无自洁功能,所以易于罹患龋病、牙周病,造成多方面的损害。上磨牙腭向牵引器和环框式下磨牙翻正器联合应

期刊

第二恒磨牙牵引器锁

基于三维骨架的时空表示与人体行为识别

与本文相关的学术论文