基于视频和三维动作捕捉数据的人体动作识别方法的研究

被引量 : 0次 | 上传用户：caonisbma

【摘要】

：

作为图像视频语义分析方向的一个新兴的研究课题,人体动作识别的研究融合了图像视频处理、计算机视觉、模式识别、统计学习、人工智能和认知科学等多学科的知识。它通过分析

【作者】

：

赵琼

【发表日期】

：

2013年期

【关键词】

：

人体动作识别高层语义搜索视觉词典视觉词袋模型多源约束近邻传播图划分问题隐马尔科夫模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

作为图像视频语义分析方向的一个新兴的研究课题,人体动作识别的研究融合了图像视频处理、计算机视觉、模式识别、统计学习、人工智能和认知科学等多学科的知识。它通过分析图像或视频等底层数据,从中提取与人体动作相关的信息,建立底层数据和高层语义之间的关系。因其在智能视频监控、人机交互以及虚拟现实等领域的广阔应用前景和深远研究意义,近年来人体动作识别问题得到了广泛的关注,研究者们提出了大量的研究方法并取得了丰硕的研究成果。本文主要研究如何从视频或三维动作捕捉数据自动识别出人体动作类别,通过对已有研究工作的分析,总结出人体动作识别算法中的两个关键性因素：1.高效的人体动作特征提取方法,2.高效的动作分类算法。本文分别从特征学习和分类器设计这两个方面提出新的思路和解决方法,它的主要贡献如下。本文提出了一个基于语义上下文分析的近语义视觉词典学习框架,称为contextual spectral embedding(CSE)框架,以及相应的基于近语义视觉词典的高层语义识别算法。它们主要解决视觉单词聚类映射方法引起的视觉单词语义模糊以及信息冗余等问题。首先,采用一种无参数的视觉单词语义相似度计算方法对视觉单词的语义上下文进行分析。其次,建立以视觉单词为结点,语义相似度为边权值的有权无向图,结合谱聚类算法对视觉单词进行聚类。语义相似的视觉单词被映射到同一个近语义视觉单词中,因而生成的近语义视觉词典在一定程度上避免了底层视觉特征与高层语义之间的“语义鸿沟”问题。该方法可以扩展到很多涉及视觉词典的高层语义识别问题中,如人体动作识别和视频概念检索。通过多个视频数据库上的人体动作识别实验和视频概念搜索实验可以得到结论,近语义视觉词典可以有效地提高这类高层语义识别的有效性和鲁棒性。本文研究了基于迁移学习的跨视角人体动作识别算法,该算法以视频的视觉单词表示为基础,通过异源异构视觉词典的协同语义学习,克服“视角障碍”问题使得不同视角下的类别标识信息能够迁移。为此提出了一个基于多源约束近邻传播方法的跨视角视觉词典学习框架,称为Bilingual visual word learning with multi-source constraint propagation(BiVWL+MSCP)(?)匡架。首先,它从视觉单词的时空分布中估计异源异构视觉单词之间的初始语义相似度,并结合多源约束近邻传播方法得到鲁棒稳定的估计值。最后,建立以异源异构视觉单词为结点,语义相似度为权值的二分图模型,采用二分图协同聚类方法对视觉单词进行聚类。语义相似但来自不同视角的视觉单词被映射到同一个跨视角视觉单词中,因此跨视角视觉词典作为桥梁使得类别标识信息在不同视角之间迁移。通过在多视角动作视频数据库上的实验得到结论,跨视角视觉词典可以有效地解决人体动作识别中的视角变化问题,达到跨视角人体动作识别的目的。本章提出了一种基于三维关节点空间时序信息的人体动作分类算法。该算法以人体三维骨架模型表示为基础,为解决维度灾难问题将一维隐马尔可夫模型扩展成空间时序隐马尔科夫模型(spatial-temporal HMM),并提出扩展的forward-backward算法解决模型的评估问题和训练学习问题。该模型不仅研究人体动作中的时序信息,同时研究人体骨架模型中相邻的关节点的空间信息。通过在动作捕捉数据库上的实验可以证明,空间时序隐马尔科夫模型在对一组常见动作类别进行识别时,它在识别率和鲁棒性方面优于一维隐马尔科夫算法。

其他文献

PLC在板带真空退火炉控制中的应用

近年来,不锈钢板材已广泛应用于食品、医疗、工业、石油化工等领域,真空退火是其不锈钢生产的重要工艺过程。为了提高不锈钢及稀有金属板材真空退火炉生产检测与控制水平,本

学位

不锈钢板带真空退火炉现场总线高精度控制Step7

广安市城镇居民财产性收入增长研究

随着资本市场的快速发展,伴随着居民理财意识的逐步增强,城镇居民的收入来源趋于多元化,尤其是财产性收入,在推动收入增长中起着不可替代的作用。党的十七大报告提出"创造条

期刊

广安市城镇居民财产性收入

拥抱5G时代

<正>要牢牢把握5G时代机遇,充分发挥贵州大数据产业优势,大力发展5G应用新业态,让5G为贵州大数据与实体经济深度融合插上快速腾飞的翅膀。63岁的何茹并不知道什么是5G通信技

期刊

习水县低时延急救车大数据产业应用创新智慧医疗马连道

船用数控曲轴内铣床结构设计与研究

随着我国船舶工业的快速发展，船用数控曲轴内铣机床作为加工其核心部件曲轴的母机也呈快速发展的趋势。由于其结构庞大、设备吨位重、制造费用高，很有必要进行预先计算、仿真，从

学位

船用数控曲轴内铣床有限元分析静力分析动态特性分析

五四运动对新时代凝聚中国力量的启示研究

从思想大解放、重视青年、推进现代化等角度看,五四运动对新时代凝聚中国力量有着独特作用。具体表现在:解放思想为凝聚中国力量提供思想活力,与时俱进为凝聚中国力量带来理

期刊

五四运动凝聚中国力量启示

科技金融助推“中国创造”

<正>要实现由中国制造向中国创造的升级,最关键的是两样法宝—创新与资本。我们一有创新存量,二有资本存量,那为什么没有将二者盘活而最终形成中国创造呢?答案可能就在于沟通

期刊

科技金融科技金融体系

可逆性后部白质脑病综合征CT和MRI影像学特点分析

目的:探讨可逆性后部白质脑病综合征(reversible posterior leukoencephalopathy syndrome,RPLS)CT和MRI影像学特点。方法:回顾性分析9例RPLS患者的临床及CT和MRI影像学资料

期刊

可逆性后部白质脑病综合征CTMRI

中美信用卡市场分析

2009年,美国经历了严重的信用卡危机,信用卡违约问题引起了国际的广泛关注。以美国信用卡危机前后的信用卡相关数据为基础,对信用卡违约率影响因素进行回归分析,从而总结影响

期刊

信用卡违约率回归分析最小二乘法信用卡危机

ARHI基因对A2780细胞及裸鼠移植瘤生长抑制作用的研究

背景据中山大学相关统计分析研究,目前我国女性卵巢癌发病率高达6.1／10万,约占卵巢肿瘤总数的5%。虽然我国卵巢癌发病率低于欧洲、北美等发达国家,但据统计分析目前我国香港、

学位

ARHI卵巢癌细胞增殖/凋亡耐药裸鼠

影响地铁列车安全运行的人为因素及对策

地铁列车安全运行事关重大,强调人为因素控制,对消除地铁列车运行安全隐患有重要作用。文章介绍影响地铁列车运行安全的人为因素;阐述加强地铁列车运行安全管理的必要性;提出

期刊

地铁列车司机调度运行安全信号系统

基于视频和三维动作捕捉数据的人体动作识别方法的研究

与本文相关的学术论文