基于结构化注意力机制的人体行为识别研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:wwp8133
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频人体行为识别,也简称为视频行为识别,是指从视频中识别特定人类对象的具体动作。人类行为丰富多样,且贯穿于生产和生活中。对视频中的人类行为进行识别,可以有效增进对视频内容的理解。识别所提供的高层语义信息,可以运用到视频监控、智能运动和行为预警等具体的应用中,有着很大的价值。视频中进行行为识别的关键信息是运动对象以及运动的主体,大部分情况之下关键信息的信息量只占视频帧的信息量的一小部分,通过凸显动作关键信息而忽视其他无关信息,能大大提高行为识别的效率和精度。受此启发,近年来不少研究者结合深度学习和注意力机制,把其应用在行为/动作识别系统上。利用注意力机制,可以在空间域上制造出注意力各不相同的关注点,从而来引导计算机集中分析与行为相关的视觉信息。然而,在实际中,用于训练深度网络的视频行为数据有限,而相关动作区域的其他特征变化显著。因此,在使用自由形式的注意掩码来实现注意力机制时,往往会因为过度拟合导致产生注意力分散的情况,从而削弱了注意力机制对动作识别所带来的帮助。针对上述的问题,本文提出了一种l2,1范数的组稀疏性正则化方法,该方法依据人类的注意力机制在生物学和认知学所呈现的局部关注的特点,通过在注意力掩码的区域上增加块状结构稀疏性的先验,使得掩码具有空间结构的约束,从而让注意力能聚焦于行为关键部位避免其产生分散现象,并根据关键部位来完成对行为的识别。本文依据结构化的注意力模块,提出了基于结构化注意力机制的卷积循环网络以进行动作识别。该网络以卷积网络和循环网络作为主体。卷积神经网络负责对视频每一帧的空域特征进行提取,循环神经网络则利用视频帧之间的连续信息,对整个视频进行行为的识别。引进的结构化的注意力机制能使得模型集中关注关键特征区域,这改善了模型的泛化能力并有效提高模型行为识别效率。本文所提出的方法在两个基准数据集上进行了实验,实验结果表明,该方法可以显着提高注意力掩码对关键运动区域关注的准确性,从而提高行为识别的性能。
其他文献
背景与目的Gpc3基因可以结构性及功能性的调节细胞的增殖、分化及基因表达。目前的研究发现其在颅骨成骨及颅缝闭合过程中有着相当重要的作用。本次研究旨在GPC3基因在颅缝组
随着新时代信息数据的爆炸式增长,人们正面临着信息超载这一不可避免且有挑战性的问题。如今基于机器学习的文本自动摘要技术,有助于人们能够快速?准确地从海量的文本数据中
反常霍尔效应(AHE)多年来吸引了人们的广泛关注,理论上,铁磁体中的AHE有公认的三种可能的来源,包括了与杂质散射有关的外禀机制和源于k-空间中的Berry相位的本征机制,这些机
目的:本研究的目的是探讨长链非编码RNA肺腺癌相关转录子2(Metastasis associated lung adenocarcinoma transcript 2,MALAT2)在胃癌(Gastric cancer,GC)侵袭转移中的相关作
第一部分电凝法制作大鼠MCAo模型目的:建立SD大鼠大脑中动脉闭塞(MCAo)模型,观察记录大鼠相关行为学变化并进行评分,病理检查证实梗死范围。方法:24只SD大鼠随机分为实验组和
表面等离激元(Surface Plasmons,SPs)是一种与金属表面紧密结合的电磁激励,可将能量紧密限制在金属与电介质的界面上。SPs可有效突破传统光子器件衍射极限的限制,可将光子器
目的明确机械牵张刺激下大鼠皮肤再生相关基因表达谱的变化,并筛选出其中的关键基因。方法建立大鼠皮肤扩张模型,以未扩张皮肤为对照,以注水量不同分组取材。分别是:对照组(c
目的甲状腺肿瘤是内分泌肿瘤中最常见的一种,近年来发病率逐年升高。本课题通过检测ZNRF3基因在甲状腺癌和癌旁组织中的表达差异,结合病例标本的临床资料,初步阐明ZNRF表达与
低频时码授时是目前国际上比较先进的电波授时技术方式。也是当前国际电信联盟(ITU)比较推崇的新一代授时技术。所谓低频授时是指授时电波的工作频率较低,并且电波的输出方式多
随着智能终端的大规模普及和物联网技术的兴起,传统无线通信系统已经呈现出高密度化的特征,预期在下一代无线通信系统中,终端数目要超过百亿,且每平方公里的设备连接数要超过