基于时空图卷积神经网络的多人行为识别研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:yichunjekiyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的不断发展与进步,视频数据的急剧增长,视频中的行为识别与分析逐渐成为我们研究的热点。基于RGB视频或光流的行为识别方法易受背景、光照和外观变化的影响,越来越多的研究者将视频序列转换为骨架序列进行研究。现有的基于骨架的研究大多是对单人骨架进行分析,而对于理解具有多人之间关系的复杂人类活动的问题还没有得到充分的解决。同时,在对行为进行分类后,理解视频中动作的本质也是我们需要思考的问题。为了进一步探索和解决这些问题,本文通过对视频中多人行为进行分析、研究。首先对视频的类别进行确认,然后剖析分类后动作的实质,最后设计并实现了交互行为识别系统。本文主要研究工作包括以下内容:(1)提出了基于骨骼图卷积的多人交互行为识别算法,以提升交互类行为识别的精度。针对多人交互动作中两人肢体行为的特点,本文提出基于骨架的时空建模方法,将时空建模特征输入到广义图卷积中进行特征学习,通过谱图卷积的高阶快速切比雪夫多项式进行逼近。我们对骨骼点之间的交互信息进行设计,使得网络能够捕获额外的交互信息,以此增加动作识别的准确性。同时为增强时域信息的提取,创新性的将切片RNN应用于视频行为识别,以捕获整个动作序列依赖性信息。实验结果表明,此方法对于交互类行为的识别有一定的作用。(2)提出了一种融合时空注意力和位移变化的主动性行为检测算法,以判断交互动作中的主动方。针对主动行为识别数据集的缺失,结合多目标跟踪技术Sort算法和人工标注的方法构建了主动行为数据集,为主动性行为的分析提供数据支持。通过时间空间注意力模型有选择性地关注输入帧内的骨骼点,并对不同帧的输出给予不同程度的注意力权重。针对主动行为识别的特点,设定一个衰减系数,增大帧间的区分度。对于注意力权重相近的动作,我们通过结合动作类别和位移轨迹变化来判断,最终来确定交互动作之间的主被动行为。实验结果表明,该方法能够有效的检测出交互动作中的主动方。(3)基于本文所研究的内容,设计并实现了一个交互行为识别系统。该系统主要包括行为识别和主动行为检测两个模块,同时添加了一个存储模块用于保存输入或输出的数据。经研究表明,设计的原型系统具有一定的社会性和价值性。
其他文献
随着智能汽车和各种车辆应用的迅速发展,智能交通和车联网等概念被提出以解决人们面临的交通及驾驶问题。车载边缘计算的相关技术作为智能交通和车联网的重要组成部分受到学术界和产业界的广泛关注。不同于一般意义的移动边缘计算,车载边缘计算环境下车辆用户速度更快、有在短时间内聚集和解散等特点,这加剧了车载边缘计算服务器负载不均衡的现象。综上,面向车载边缘计算的负载均衡研究面临上述新的挑战。本文针对经典的负载均衡
随着移动机器人柔性及智能化程度的日益提升,基于多移动机器人的智能物流搬运系统在智能仓储、港口运输等领域的应用愈加广泛。如何提升多移动机器人路径分布的均衡性,避免多移动机器人系统发生碰撞及死锁现象,是保证多移动机器人系统运行效率及稳定性的重要一环。本文以应用于快递分拣的多移动机器人系统为研究对象,对其路径规划、避碰交通管理等关键技术进行了研究。主要工作包括以下几个部分:首先,针对应用于快递分拣的多移
超级电容器以其高效、循环稳定性强和安全性高等突出特点成为了解决能源危机的有效途径之一。然而,能量密度低这一问题使得超级电容器的市场占比逐年减少。电极材料作为超级电容器的关键部位,对其整体性能.有着不可或缺的影.响。因此,对电极材料性能的研发成为了研究焦点。目前,理论比电容量高、储存量丰富和环境友好的钴基材料被视为理想的电极材料之一。然而,其较差的电导率和稳定性极大地制约了其进一步发展。本文通过对不
脉冲耦合神经网络(Pulse Coupled Nerual Network,PCNN)是一种高度模仿生物视觉神经元系统的网络模型,由于其具有同步脉冲输出、神经元捕获、动态阈值等独特的生物学特性,因此适用于图像的去噪处理。另一方面,在不断提高PCNN网络性能的过程中,一些关键性难题值得研究和关注,其中PCNN的参数设置问题、硬件化实现困难问题是十分具有解决意义的研究方向。忆阻器是一种新型的非线性无源
软件漏洞的存在对软件的质量和安全问题造成了严重的威胁,攻击者可以利用软件漏洞从而在未获得授权的情况下访问系统甚至对系统进行攻击。源代码具有丰富的语义,并且针对源代码进行静态分析已被广泛应用于软件开发过程。此外,软件开源化已逐渐成为软件开发的主流趋势,开源软件中存在的漏洞会随着开发人员复用开源代码而广泛传播。随着现有软件规模的逐渐扩大,以及漏洞出现的频率不断提升,急需开展源代码静态漏洞检测相关的研究
近年来,多目标优化问题是工业界与科学研究领域中的研究热点。多目标优化算法的目的是获得一组均匀分布在整个帕累托前沿面上的最优解。其中,基于偏好的多目标优化算法将决策者的偏好信息融入到多目标优化算法中可以缩小搜索空间、减少计算开销、获得部分解,得到了研究者的广泛关注。传统基于角度偏好多目标粒子群优化算法具有实现简单、偏好区域范围能灵活控制以及收敛性好等优点,但在处理复杂问题时,算法对优秀粒子缺乏足够的
表面等离激元(SPPs)作为现代纳米光学的重要部分,有着巨大的发展潜力。SPPs可将光场局限在亚波长尺度空间内,使得人们可以在亚波长范围内对光信号进行激发和调控,因此,SPPs在生物、化学、信息等领域具有重要的应用前景。近年来,二维材料因其等离激元具有电光可调性和低损耗的优势得到了人们的广泛关注。其中,最具代表性的材料就是石墨烯。目前,已有多种石墨烯等离激元器件,包括可调谐的石墨烯阵列滤波器、布拉
近年来,随着计算机硬件的飞速发展、更多的人脸数据集和深度神经网络的不断改进完善,基于深度学习的人脸检测算法已成为了人脸检测的主流,并在多数场合特定环境下,满足了大数据时代背景下人们对于人脸检测系统的性能、实时性、准确性以及智能性方面的需求。但是,在视频监控等领域,系统设备由于受到成像设备性能、特定环境、目标距离、光照天气等因素影响,无法提供高清图像进行后续的人脸检测分析,而当前人脸检测算法在低分辨
开绕组永磁同步电机(Open Winding Permanent Magnet Synchronous Motor,OW-PMSM)拥有传统PMSM结构简单、功率密度高和运行效率高的优点,在农业植保机、电动拖拉机、农业机器人等高端农业装备领域具有很好的应用前景。其中,共母线OW-PMSM在高母线电压利用率的前提下仅需单个直流电源供电,极其适用于高压大功率电驱系统。本文针对共母线OW-PMSM驱动系
近年来,智能网联汽车(Intelligent Connected Vehicle,ICV)在互联网技术的推动下,其智能化水平得到了极大提升,但也暴露了车内网络安全问题。ICV具有较多的车内远程接口以及对外通信功能,这使得攻击者可以通过该接口并利用车内网安全漏洞实现对车辆的控制。目前,针对由远程攻击造成的车内网络安全问题,国内外专家学者已经提出了诸多防护机制,如身份认证、数据加密和密钥更新等技术,这