基于姿态序列的视频人体动作识别研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户：lisky

【摘要】

：

【作者】

：

黄晨

【出处】

：

华东师范大学

【发表日期】

：

2021年03期

【关键词】

：

视频动作识别图卷积姿态估计注意力机制双流LSTM网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着图像传感器技术的发展和高清摄像头的进一步普及,作为机器动态感知三维世界的“眼睛”,视频智能理解愈发受到关注。相比于单幅静态图像,视频流包含的运动信息更加丰富。基于视频流的人体动作识别是视频智能理解中的一项关键技术,本质上是对视频序列帧中有关人体行为的特征向量进行编码并分类的过程。近年来,深度学习的快速发展颠覆了传统视频人体动作识别技术,其能够自适应学习视频序列中的高层抽象特征。在进行人体动作识别时,相比于其它特征信息,姿态特征鲜明、简洁且受外观因素干扰程度小,且有研究工作显示基于深度神经网络的特征提取对于基于人体姿态估计的动作识别有着显著的效果。因此,本文以深度神经网络模型为手段,从人体姿态估计问题出发,基于人体姿态序列来识别行为动作并进行实验验证,具体研究内容如下:(1)提出了一种基于通道注意力与多尺度特征融合全卷积网络的自顶向下多人姿态估计方法,有效提高了复杂场景下多人姿态估计准确度和速度。在人体姿态估计网络对特征图进行下采样过程中,上层高分辨率信息会不断遗失。针对这一问题,在经典U型人体姿态估计网络的结构中嵌入了多尺度特征融合模块,使得网络中的低尺度特征也包含高分辨率信息,并且为了进一步突出多尺度融合特征图的关键通道信息,在特征融合模块中引入通道注意力机制。实验结果表明了基于通道注意力和特征融合的多人姿态估计算法的有效性和优越性。(2)提出了一种时域流与空域流并联的双流LSTM动作识别网络。对时域流网络分支中的原LSTM网络模型进行拓展,引入时域全局上下文注意力单元使网络有选择性地聚焦于具有关键动态信息的骨架帧;在空域流网络分支的主干LSTM网络中,加入了具有骨架关键点选择机制的空间注意力模块,使得网络能自适应地分配权重给不同骨架关键点,从而能选择性地关注用于区分不同动作行为的重要关键点。实验结果表明了双流LSTM网络模型的有效性和优越性。(3)提出了一种联合关键点和肢体图卷积过程的ALT-GCN网络模型。通过定义肢体边的邻域关系构建了一套不同于骨架关键点图卷积的运算过程,以更好地利用骨架肢体信息。采用可自适应学习图拓扑结构的图卷积(ALT-GCN)模块来替换基础的时空图卷积(ST-GCN)模块,使得网络随着层级不断深入可以学习得到更优的拓扑图连接,并优化图卷积层次结构,能更好地识别不同动作种类,实验结果验证了ALT-GCN网络模型的有效性和优越性。综上所述,本文通过研究基于人体姿态序列的视频动作识别关键技术,对从人体姿态估计至人体姿态特征编码和分类等难点问题,提出了有效的解决方案,从而为视频人体动作识别算法的研究和实际应用提供了有效的解决思路。

其他文献

立体选择性羰基还原酶的筛选、制备及应用

　　立体选择性羰基还原酶(carbonyl reductase,EC 1.1.1.184)属于短链醇脱氢酶/还原酶家族,能够立体选择性催化前手性酮不对称还原得到手性醇.手性醇含有一个活泼的羟基官能

会议

我国生物技术药物产业计量测试需求分析

<正>一、对关键测试参数的量值溯源能力的需求1.生物特性标准物质生物测试技术的特殊之处在于,一个参数的测试过程涉及多个技术的组合操作,如待测样品的前处理、标准品的配制

期刊

测试需求分析生物技术药物产业计量纯化水系统在线监测溯源性生物分析量值溯源生物制药企业标准品测量仪器在线计量

18-8大型不锈钢立式储罐焊接要点分析

18-8不锈钢作为一种常用的钢材,在化工及食品、制酒等领域已广泛应用,但应用在大规模的立式储罐上还是不多。本文以5000m3不锈钢罐（0Cr18Ni9）的焊接为依托,结合立式储罐的焊接

期刊

晶间腐蚀热裂纹角变形

钢箱梁桥面新型组合铺装施工技术

结合郑州市三环路陇海立交匝道钢箱梁桥面“钢纤维混凝土＋双层沥青混凝土”新型组合铺装工程，介绍了钢箱梁桥面组合铺装施工工艺流程及施工质量控制方法，探讨了施工各阶段的质量

期刊

钢箱梁匝道组合铺装施工控制

我国信贷资产证券化发展研究——现状、问题与对策

我国信贷资产证券化业务的现状呈现出投资者和基础资产多元化、盘活银行信贷资产存量以支持实体经济发展、信息披露和信用评级等市场化约束机制逐渐形成的特点。文章指出了信

期刊

信贷资产证券化信息披露信用评级市场化金融创新

探析新媒体时代如何让电视主题报道更接地气——以丽水市广播电视总台新闻综合频道为例

主题报道是新闻工作的一项重要内容。在新媒体崛起,观众收视进入多元化的今天,如何做活、做深、做接地气的主题报道,是提升传统媒体影响力的关键之一。近年来,丽水市广播电视

期刊

新媒体时代主题报道

激发和浓度双重依赖的多色荧光碳点的性能及应用

碳点（CDs）作为一种新型的碳基荧光纳米材料,由于其优异的水溶性、低毒性、独特的光学性能、良好的生物相容性和易于表面功能化等优点,受到人们的广泛关注。特别是具有多色荧光

学位

多色碳点激发依赖浓度依赖重金属离子检测ATP水解

公共健康视角下茶园景观空间优化设计探析

随着城市化进程的加快,人们在高楼大厦的现代生活中越来越关注生态景观美。茶园景观作为生态景观之一,也越来越受人们的追捧和喜爱,一个好的景观设计将带给人们美的感受,而如

期刊

茶园景观景观设计空间优化公共视角

公债与经济增长的因果关系实证研究

在市场经济条件下,公债能否促进长期经济增长是公债存在与否的根本依据。基于42个国家1991~2009年的面板数据,通过面板单位根检验,协整检验和格兰杰因果检验,实证研究了公债

期刊

公债经济增长面板数据协整检验格兰杰因果关系

基于人工神经网络的中国农业干旱灾害的模拟与分析

干旱不仅影响自然环境和生态系统的平衡,且对农业生产造成严重后果,是制约我国农业发展的主要因素之一。农业干旱监测的传统方法主要是关注植被状况和土壤湿度等单一因素的影

学位

气候变化作物损失率干旱分析人工神经网络时空模式

基于姿态序列的视频人体动作识别研究

其他学术论文