基于多特征学习的人体动作识别技术研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:ivsou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别是计算机视觉领域的一个重要的研究方向,旨在使计算机能够自动识别人体动作。人体动作识别技术在智能监控、无人驾驶、人机交互等方面都有广泛的应用。随着深度学习被应用于人体动作识别领域,人体动作识别准确率有了显著提升。这其中空域特征与时域特征最为常用,然而时空特征存在复杂多样性和时空对应关系利用不足的问题。针对人体动作时空特征复杂多样性以及时空特征之间对应关系利用不足问题,本文对基于多特征学习的人体动作识别技术进行研究,具体内容如下:(1)针对人体动作时空特征复杂多样性,本文提出了基于多特征学习卷积神经网络。该网络以传统双流网络为框架,在视频预处理时,采用时间关联性采样TRN(Temporal Relation Network)算法,该方法可以充分利用不同帧之间的关联性。在提取空域特征时,为了解决空域特征的复杂多样性,使用具有强大特征描述能力的残差网络来提取空域特征;在提取时域特征时,考虑到光流特征提取耗时的问题,采用结构简单的BNInception网络来加速光流特征的提取。为了提高光流特征的利用率,本文提出了跨模态预训练,在光流图像送入时域特征提取网络之前,首先通过线性变换将光流场离散到RGB图像像素值所在区间,然后修改RGB预训练模型卷积层的权重,使其更适合处理光流图像。时空特征进行融合后再进行分类,得到动作识别的结果。(2)针对时空特征之间的对应关系利用不足,本文提出了基于运动激励与时间聚合的多特征学习人体动作识别算法。该算法在多特征学习卷积神经网络的基础上,将本文提出的运动激励与时间聚合模块加入到空域特征提取网络,用来建立空域与时域特征之间的对应关系。该模块由多尺度动作激励模块和挤压激励时间聚合模块构成。多尺度动作激励模块使时间维度三个相邻时刻的特征依次作差,再将作差后的特征进行拼接,获得由特征级时间差表示的运动特征,以建立空域与短时时域特征之间的对应关系。挤压激励时间聚合模块将局部卷积变形为一组子卷积,多个子卷积组成层次结构共同提取特征,特征经过增强或抑制后与多个子卷积共享,使最终的时态感受野增大,以建立空域与长时时域特征之间的对应关系。上述两个模块同时分别建立空域与短时时域和长时时域特征之间的对应关系,在空域特征提取网络上解决时空特征之间对应关系利用不足的问题。空域特征与经过跨模态预训练网络提取出的时域特征进行融合,进过分类器得到最终的分类结果。本文在UCF101和HMDB51两个数据集上进行了验证,基于运动激励与时间聚合的多特征学习人体动作识别算法识别准确率分别为96.0%和71.2%,有效提高了识别准确率。
其他文献
地基合成孔径雷达(Synthetic Aperture Radar,SAR)作为一种高精度测量技术,具有全天候、非接触式和设站灵活等优点,能够实时监测场景的形变情况和变形趋势,自问世以来就成为了对地观测的重要工具。随着应用需求的日益增加,逐渐出现了不同体制的地基SAR系统,为了满足三维信息获取和多角度观测等需求,圆周扫描地基SAR应运而生。与线性地基SAR相比,该系统观测范围更大且具有三维分辨能力
学位
由于铁路运输和轨道交通在我国的发展速度非常迅猛,因此保障轨道系统的安全稳定运行和对轨道交通运输安全维护的工作非常关键。当火车在高速行驶的时候,异物进入列车轨道区域可能会造成巨大事故,给旅客的人身安全和财产安全造成很大的隐患。国内外高速铁路行驶中的最大安全问题来自人、动物进入轨道周界或边坡落石进入铁路限界。所以,在铁路周界区域内进行有效快速的异物侵限实时检测于监控对预保障行车安全发挥着很大作用。随着
学位
汽车的智能化已经成为当前时代发展的必然趋势,而针对车辆行驶环境中的行人进行高精度感知是保障车辆自动驾驶安全性的关键,也是自动驾驶的重要保障。该问题涉及到对行人姿态实现高精度的识别,面临多人姿态识别的复杂性、环境背景的干扰、识别速度与计算开销的均衡等多个方面的困难。本文针对在高复杂背景下应用于自动驾驶上的多人姿态识别网络算法展开研究,针对性解决在车辆行驶环境下多人姿态检测的精准度低、检测速度慢两个方
学位
目前,管道安全预警领域中应用较广的光纤预警系统具有抗干扰能力强、敏感度高等优点,且能够实现对长距离管道运输过程中的外界入侵事件监测识别和定位。该系统利用光纤传感技术采集入侵事件产生的振动信号,然后结合信号处理技术和模式识别技术实现对入侵信号的识别,从而预防入侵事件引发油气管道事故。本文基于相位敏感光时域反射技术的光纤预警系统,开展该系统中对光纤入侵信号的特征提取与识别算法研究。本文首先分析了光纤入
学位
圆周扫描地基SAR(Circular scanning ground-based SAR,GBCSAR)是一种具备三维成像能力的新体制地基SAR系统,它将圆迹SAR模式引入地基平台。区别于传统的直线轨道地基SAR,它通过圆周运动采集数据,从而形成二维合成孔径,掌握场景的三维信息,具备三维成像、数据采集便捷的优势,但其特殊的圆周运动轨迹给三维成像增加了难度。尽管国际上已经理论论证了其三维分辨能力,但
学位
近年来随着航空科技的不断发展,无线遥测遥控领域用户终端以及数据吞吐量在不断的增大,如何高效利用频谱资源已经成为人们研究的热点。为了提高频谱利用率一般可采用扩频技术或者高效的调制方式来实现。成型偏移正交相移键控(SOQPSK)信号属于一类连续相位调制信号,其包络恒定并且具有频谱利用率高和功率利用率高的优点,现已经被列入IRIG106航空遥测标准。美国军方也采用了此标准,用于卫星通信和宇航中。SOQP
学位
近年来航天发射任务日益增多,对遥测系统可靠性要求日益提高。遥测发射机是遥测系统最为核心的工作设备,直接影响着遥测数据获取的质量与效果,决定了遥测任务的成败。传统箭载遥测发射机主要采用超外差结构实现发射通道,该结构采用多级串联变频,结构冗长、使用分立器件多,系统故障率相对较高。本课题结合航天发射任务要求,采用结构简单的零中频结构和冗余备份设计对传统超外差式箭载遥测发射机提出高可靠化改进。设计并实现了
学位
面向视频数据的行为智能分类研究因其具有重要意义和应用价值,目前已经逐渐成为学术界与产业界的研究重点。该研究不仅苛求于算法模型能够挖掘视频中完备的空间特征,亦需对时间信息进行有效表达。尤其是在时间建模方面,近年来的算法研究多数通过引入时间差分操作来提取相邻帧之间的运动信息,并使用相加融合或注意力融合的方式将其融入到原始特征当中,取得了一定效果。然而,通过分析,时间差分操作以及对运动信息无差别对待的方
学位
随着智能化时代的到来,目标识别技术已在诸多领域得以实现。针对不同的识别任务人们常依赖于专家经验所设计的网络,这就需要专家具备较高的设计水平和实践能力,无形中拉高了网络框架设计的门槛。因此借助神经网络架构搜索算法实现网络的自动搜索成为了当今研究的热点,通过神经网络搜索出的网络具有参数量小、模型复杂度低、检测速度快等优点。本文的第一个研究内容是选择一个最适合与MobileNet轻量化网络结合的目标识别
学位
铁路环线信号已被应用于轨旁电子设备(Line Side Electronic Unit,LEU)向高铁车载设备的半连续通信,其特点是采用了直接序列扩频调制方式。该信号可以传递行车速度、坡度和列车定位信息。目前,铁路环线通信技术主要应用在欧洲列车控制系统(European Train Control System,ETCS)中。在我国,随着国家关于中欧铁路环线通信合作项目的推进,同样需要开展铁路环线
学位