基于结构化注意力机制的人体行为识别研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户：wwp8133

【摘要】

：

视频人体行为识别,也简称为视频行为识别,是指从视频中识别特定人类对象的具体动作。人类行为丰富多样,且贯穿于生产和生活中。对视频中的人类行为进行识别,可以有效增进对视

【作者】

：

陈一鑫

【出处】

：

华南理工大学

【发表日期】

：

2004年期

【关键词】

：

行为识别注意力机制结构稀疏性深度循环网络卷积神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

视频人体行为识别,也简称为视频行为识别,是指从视频中识别特定人类对象的具体动作。人类行为丰富多样,且贯穿于生产和生活中。对视频中的人类行为进行识别,可以有效增进对视频内容的理解。识别所提供的高层语义信息,可以运用到视频监控、智能运动和行为预警等具体的应用中,有着很大的价值。视频中进行行为识别的关键信息是运动对象以及运动的主体,大部分情况之下关键信息的信息量只占视频帧的信息量的一小部分,通过凸显动作关键信息而忽视其他无关信息,能大大提高行为识别的效率和精度。受此启发,近年来不少研究者结合深度学习和注意力机制,把其应用在行为/动作识别系统上。利用注意力机制,可以在空间域上制造出注意力各不相同的关注点,从而来引导计算机集中分析与行为相关的视觉信息。然而,在实际中,用于训练深度网络的视频行为数据有限,而相关动作区域的其他特征变化显著。因此,在使用自由形式的注意掩码来实现注意力机制时,往往会因为过度拟合导致产生注意力分散的情况,从而削弱了注意力机制对动作识别所带来的帮助。针对上述的问题,本文提出了一种l_2,1范数的组稀疏性正则化方法,该方法依据人类的注意力机制在生物学和认知学所呈现的局部关注的特点,通过在注意力掩码的区域上增加块状结构稀疏性的先验,使得掩码具有空间结构的约束,从而让注意力能聚焦于行为关键部位避免其产生分散现象,并根据关键部位来完成对行为的识别。本文依据结构化的注意力模块,提出了基于结构化注意力机制的卷积循环网络以进行动作识别。该网络以卷积网络和循环网络作为主体。卷积神经网络负责对视频每一帧的空域特征进行提取,循环神经网络则利用视频帧之间的连续信息,对整个视频进行行为的识别。引进的结构化的注意力机制能使得模型集中关注关键特征区域,这改善了模型的泛化能力并有效提高模型行为识别效率。本文所提出的方法在两个基准数据集上进行了实验,实验结果表明,该方法可以显着提高注意力掩码对关键运动区域关注的准确性,从而提高行为识别的性能。

其他文献

Gpc3基因在SD大鼠颅缝组织细胞中表达的研究

背景与目的Gpc3基因可以结构性及功能性的调节细胞的增殖、分化及基因表达。目前的研究发现其在颅骨成骨及颅缝闭合过程中有着相当重要的作用。本次研究旨在GPC3基因在颅缝组

学位

颅缝GPC3SD大鼠基因表达

结合迁移学习的文本自动摘要技术研究

随着新时代信息数据的爆炸式增长,人们正面临着信息超载这一不可避免且有挑战性的问题。如今基于机器学习的文本自动摘要技术,有助于人们能够快速?准确地从海量的文本数据中

学位

文本自动摘要seq2seq编码器-解码器模型迁移学习

α-Mn结构Fe-Mn合金的磁电输运研究

反常霍尔效应(AHE)多年来吸引了人们的广泛关注,理论上,铁磁体中的AHE有公认的三种可能的来源,包括了与杂质散射有关的外禀机制和源于k-空间中的Berry相位的本征机制,这些机

学位

自旋玻璃反常霍尔效应外延生长

LncRNA MALAT2在胃癌中的表达及功能研究

目的:本研究的目的是探讨长链非编码RNA肺腺癌相关转录子2(Metastasis associated lung adenocarcinoma transcript 2,MALAT2)在胃癌(Gastric cancer,GC)侵袭转移中的相关作

学位

肺腺癌转移相关转录子2(MALAT2)长链非编码RNA(long noncoding RNAlncRNA)胃癌(GC)上皮间充质转化(EMT)

运动皮层电刺激促进MCAo大鼠运动功能恢复的实验研究

第一部分电凝法制作大鼠MCAo模型目的:建立SD大鼠大脑中动脉闭塞(MCAo)模型,观察记录大鼠相关行为学变化并进行评分,病理检查证实梗死范围。方法:24只SD大鼠随机分为实验组和

学位

大脑中动脉电凝法转棒试验平衡木试验悬空旋转试验电刺激运动功能微管相关蛋白-2

表面等离激元谐振腔的耦合特性分析及其传感应用研究

表面等离激元(Surface Plasmons,SPs)是一种与金属表面紧密结合的电磁激励,可将能量紧密限制在金属与电介质的界面上。SPs可有效突破传统光子器件衍射极限的限制,可将光子器

学位

表面等离激元谐振腔温度传感高灵敏度

机械牵张刺激下大鼠皮肤再生的关键基因筛选

目的明确机械牵张刺激下大鼠皮肤再生相关基因表达谱的变化,并筛选出其中的关键基因。方法建立大鼠皮肤扩张模型,以未扩张皮肤为对照,以注水量不同分组取材。分别是:对照组(c

学位

皮肤扩张机械牵张皮肤再生基因芯片

ZNRF3在乳头状甲状腺癌中的临床意义及生物功能学研究

目的甲状腺肿瘤是内分泌肿瘤中最常见的一种,近年来发病率逐年升高。本课题通过检测ZNRF3基因在甲状腺癌和癌旁组织中的表达差异,结合病例标本的临床资料,初步阐明ZNRF表达与

学位

E3泛素连接酶乳突状甲状腺癌WNT信号通路抑癌基因

低频授时设备优化及管理研究

低频时码授时是目前国际上比较先进的电波授时技术方式。也是当前国际电信联盟（ITU）比较推崇的新一代授时技术。所谓低频授时是指授时电波的工作频率较低,并且电波的输出方式多

学位

低频时码技术授时设备大数据统计数据质量

高密度网络中快速动态干扰协调方案研究

随着智能终端的大规模普及和物联网技术的兴起,传统无线通信系统已经呈现出高密度化的特征,预期在下一代无线通信系统中,终端数目要超过百亿,且每平方公里的设备连接数要超过

学位

动态干扰协调超密集网络资源分配深度强化学习离散小波变换

基于结构化注意力机制的人体行为识别研究

其他学术论文