基于时空关系增强的人体动作识别算法研究与实现

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:zy34970348
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的快速发展,视频逐渐成为数据存储的载体。因此视频理解作为人工智能中一个重要的研究领域,受到各方面学者的关注。人体动作识别作为其中的代表任务,可广泛应用于智能监控、团体活动分析、视频摘要生成等诸多领域。人体动作识别(又称行为识别)是指在给定的一段视频序列中,判断其中包含的动作类别,例如跑步、握手、拳击等。但与基于图像的目标识别、检测等任务不同的是,视频数据较为复杂,帧间相似度较高,直接处理极易导致模型陷入过拟合,并且需要较大计算能力。因此,如何设计出高效的人体行为识别算法成为当下亟需解决的问题。本文基于深度学习中的卷积神经网络和注意力机制,从动作时序性和空间联系性角度出发,设计出两种新型的动作识别算法,通过实验证明了所提出的结构有效提升了动作识别的准确率,同时做了一系列扩展实验,探索不同因素对人体动作识别的影响。本论文的主要工作如下:1、对传统数据预处理方式进行优化,抛弃视频抽帧步骤,降低冗余解码步骤,大大减轻硬盘存储压力,也减低数据读取死锁情况的发生。提出的方法采用在线学习的方式进行数据装载,以视频文件为样本主体,利用指针进行滑动,读取所需的关键帧,大大提升了计算效率,同时也加快了模型迭代所用时间。针对数据碎片化后迁移成本较高,本文利用HDF5文件格式,将光流特征进行封装,增强了数据的便携能力的同时,也提高了I/O利用率。2、由于动作基于时间发展,使得不同动作在时序上均表现出该动作特有运动变化模式。针对上述特性,本文设计了多种时序捕捉模块,探索其对动作识别任务准确率的影响。通过大量实验分析,本文创新性提出了Multi-Head Sigmoid Self-Attention模型用于动作时序捕捉,利用Sigmoid完成注意力值的激活,减少时序特征间的强竞争性,并结合Mutli-Head结构进行多组模版关系学习,生成更加强健的特征,通过在HMDB51数据集上实验证明,提出的模块可有效的提高人体动作识别的准确率。3、动作往往是由多个目标间的相互作用而形成的,目标间存在较强的联系,并且图像上各区域对动作理解所作贡献也不尽相同。因此本文提出空间注意力网络用以抓取空间上物体之间的关系,并结合残差结构设计出多种激活方式,实验证明,空间注意力网络可有效的提升人体动作识别准确率。4、本文将神经网络训练中的一些训练策略迁移至动作识别领域进行实验,探索激活函数、训练策略、网络深度等因素对人体动作识别的影响。
其他文献
德国蔡司公司发明的IOLMaster人工晶体生物测量仪创新性地解决了精确测量眼睛和手术前对眼球晶体进行精确计算的难题。目前IOLMaster 700作为最新一代的人工晶体生物测量仪已
随着电力行业的快速发展,电力基础设施建设不断向偏远地区延伸。施工队常在地形复杂,手机信号差的山区进行施工。这给安全管理带来挑战:由于视野受限与人员分散,安全人员对工
本文尝试以马克思共同体思想为视角重新审视分配正义问题,试从“虚假共同体”、社会主义阶段和“真正的共同体”对分配正义问题分别展开讨论,为新时代中国特色的分配正义提供
无线中继通信技术能够扩大通信覆盖范围,提高信息传输的可靠性;多中继技术可以有效提高通信网络的分集增益,在提高系统可靠性的同时提高系统有效性;多天线技术可以提高系统容量和改善链路的传输可靠性。因此在提高通信网络系统性能的前提下,研究中继通信技术有着重要大意义,提高通信网络的可靠性和有效性是现今通信的追求,进一步讲,由于无线中继节点的电池容量受限,由此研究新型的无线携能传输技术非常必要。针对能量采集的
近年来对地理标志大米产地真伪性鉴别的研究主要集中在基于过程追溯的大米产地溯源系统技术与基于源头鉴别的大米产地确证技术两个方面,其中产地溯源系统中企业为整个溯源提供基础的数据来源,难以避免人为因素对溯源结果造成影响,可能出现“真条码,假溯源”的产地造假现象。而结合机器学习算法的大米产地确证技术虽然获得了较好的鉴别效果,但是在处理大规模数据时,传统的机器学习算法的时间复杂度较高,产地确证模型分类效率较
人体平衡能力是衡量身体健康程度的重要指标。平衡能力弱或平衡障碍通常表现为站立或行走不稳,容易造成跌倒。随着人口老龄化的加剧,我国每年有4000万老人因平衡障碍而发生跌
卷积神经网络(CNN)是由人工神经网络扩展而来的一种深度学习结构,近年来,已被广泛应用于视频监控、移动机器人视觉、图像搜索引擎等领域。CNN是一种计算密集型算法,通用处理
本文主要研究了三方网络博弈和战争博弈,对于研究实际中的竞争关系和模式有重要意义。文章从分析网络的有效性和纳什性入手,将在社会实际中的竞争博弈关系体现为实力不均等的
随着经济全球化的深入,企业面临的竞争压力越来越大。在这种背景下,企业希望通过提升产品一次检测合格率,来减少返修费用、增加效益等,因此越来越多的企业探索通过精益六西格玛管理来提升产品一次检测合格率。中国企业虽然也在不断探索使用精益六西格玛管理来解决类似的问题,然而真正成功实施的却并不多见。因为国内对精益六西格玛管理的研究还主要停留在理论层面,如何同中国企业的发展实际相结合,形成一套符合企业文化的精益
三棵树苗寨位于贵州省凯里市三棵树镇下属的开怀街道,当地的社会历史变迁经历了从无到有、合乡建镇、特色小镇三个发展阶段。1970年,周边村寨的苗族村民被有计划地迁居此地,形成了三棵树苗寨;1995年,省、市级单位将该地与周边乡镇合并,成立了三棵树镇政府;2007年-2016年,三棵树镇主动完成民族特色改造工程,被国家纳入“特色小镇”的建设规划。三棵树地区内的生计发展根据国家建设不同阶段的侧重而有所变化