视频人体行为识别深度学习算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xulei25163974
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频人体行为识别任务是利用计算机自动分析处理视频数据,得到人体行为类别的过程,是计算机视觉领域最具挑战的任务之一。电子技术的发展使得计算机处理能力大大增强,存储设备容量也得到提升。各类高清视频设备的广泛应用,使得人体行为识别在智能安防、人机交互等领域有着较为广阔的应用前景,同时推动了行为识别算法研究的进一步提升。传统的人体行为识别算法通常采用人工设计特征的方式提取信息,而这些方法往往工作量较大,算法设计复杂,在面对复杂真实场景时,易受到遮挡、光线、角度变化等的干扰,识别准确率较低。而深度学习的发展为视频中人体行为识别算法设计带来了新的思考,现有基于深度学习的行为识别算法主要针对视频序列、骨架序列、深度图像序列这三种不同的数据形式进行研究。其中骨架序列避免了更多噪声的干扰,同时描述了视频中人体的姿态信息;视频序列普适性较强,易于数据的采集和模型的应用推广。本文采用姿态估计算法提取的骨架序列及原始视频序列两种模态数据分别实现两类人体行为识别的网络模型,得到了较高的识别率。本文针对可表征姿态信息的骨架序列数据,展开基于姿态估计算法的行为识别研究。首先使用准确率及检测速度均具优势的目标检测算法Yolo对原始视频中的人体模型检测分割,其次对并行多分辨率网络模型HRNet进行改进,提出改进的多尺度融合姿态估计算法MHRNet。在此基础上实现对视频中已分割人体目标更为细致准确的人体骨架关键点特征信息提取。进而设计两种以LSTM循环神经网络为基础的模型完成视频的骨架关键点坐标信息及时序信息的学习和训练,最终实现视频中的人体行为识别。并通过公开的人体姿态估计数据集和人体行为数据集验证改进的姿态估计算法及实现的行为识别算法,均具有较好的识别效果。本文针对实际应用中较骨架序列数据更易获取的原始视频序列数据展开行为识别研究。因视频序列具有空间和时间两个维度,本文在快慢网络(SFNet)的基础上设计一种分段式快慢采样的双分支网络模型(MSFNet),对两个维度的特征信息分别建模。并引入注意力机制以解决视频序列数据背景复杂冗余性高、运动信息不够明显的问题,可对视频序列中不同帧以及同一帧的不同位置给予不同的关注,学习对行为识别更为有效的时空信息,最终在公开人体行为数据集上进行验证,说明基于注意力机制的人体行为识别模型具有更好的识别效果。
其他文献
全局优化算法一直是计算机理论科学研究的重点,涉及生产制造、物流运输、网络服务等诸多领域。构型空间进化算法(Configuration Space Evolutionary,CSE)是一种先进的全局优化算法,具有良好的全局搜索能力和较强的健硕性。本文以企业生产中设施布局以及网络服务中信息检索为应用背景,主要研究多目标动态设施布局问题(Multi-objective Dynamic Facility
本研究的节能型木材干燥窑主要由窑体,进排气道、专用换热器等组成。本研究结合生产实际,通过理论计算和数值模拟相结合,完成了节能型木材干燥窑的结构优化设计和节能效果分
随着人们教育意识的不断增强,出国留学也越来越大众化。旺盛的留学市场需求也导致留学中介行业快速发展,留学中介从起步发展到饱和状态,依靠留学需求和信息不对称而存在的留学中介已经远远不能满足客户不断升级的个性化需求。近年来,留学市场上出国人员数量保持持续上升的趋势,但留学中介却开始面临客户量逐年下降、业绩不断下滑的趋势。客户需求的升级对留学中介的挑剔程度越来越高,留学中介要不断适应客户个性化需求的升级,
随着仿生学研究的兴起,越来越多的领域引入了仿生学理念,或提出了新的结构,或实现了功能上的改进与完善,而MEMS领域也同样可以和仿生学结合。MEMS是微机电系统的缩写,它是指一种能够把传感器,执行器,信号处理器和控制电路都集成到一起的微型器件。微机械谐振器是MEMS中的一个重要组成部分,目前被应用在多种电子设备之中。评价微谐振器的优劣,主要通过品质因数,即系统自身所具有的能量与振动过程中损失能量的比
水曲柳(Fraxinus mandshurica Rupr)属木犀科(Oleaceae)梣属(Fraxinus)雌雄异株的木木植物。为分析水曲柳雌雄之间的差异,对水曲柳的性别鉴别方法进行初步研究,本试验测序获
Al-Si合金由于具有较高的比强度和导热性,较低的热膨胀系数和易于加工等优异性能,广泛应用于汽车和坦克发动机的热端部件中。随着发动机向高转速、高性能的方向发展,对Al-Si合金的力学性能和耐热性能提出了更高要求,表面改性是提高其综合性能的最行之有效的方法。但是对于Al-Si合金来说,单一的表面处理方法很难满足综合性能的要求,复合表面处理是改善综合性能的有效途径。本论文通过激光冲击强化(LSP)的表
甲状腺结节是甲状腺系统的常见病症,恶性结节则会有癌变的风险,针对恶性结节,及时进行诊断治疗后大多数都能够治愈。超声检查是目前针对甲状腺结节最为常用的诊断方法。为了解决医生诊断阅片耗时且由于个人经验不同容易发生误检漏检等问题,基于超声影像的计算机辅诊技术在临床上有着重要意义。目前,应用于甲状腺结节的传统的结节分割方法主要基于图像处理技术与主动轮廓模型。这类方法无法学到针对甲状腺结节的专业特征知识,并
石榴是温度敏感型果实,褐变、失水、腐烂影响石榴营养价值和市场价值,严重危及云南建水石榴的长远发展,亟需明确建水酸石榴贮藏保鲜关键技术,研究其和变衰老的机理,直接或间
随着人类社会的发展和人民生活水平的提高,食品安全问题受到越来越广泛的关注,农药残留在食品安全问题中显得尤为突出。蔬菜中的农药残留比较严重,因农药使用不合理造成的食品安全问题屡屡发生。有机氯农药百菌清(CHT)常被用于防治蔬菜的真菌病害,CHT的使用给农业生产带来巨大收益的同时,其母体残留及降解产物毒性问题引起广泛关注。需建立一种能够快速同时分离检测蔬菜中的CHT及其降解产物的方法。本论文旨在以CH
InP/ZnS核壳量子点具有与镉和铅类量子点相似的光学性质以及低毒性,在光限幅器、太阳能电池、发光二极管和生物标定等领域具有巨大的潜在应用价值。研究InP/ZnS核壳量子点的光学物理特性,可以为实际应用提供理论指导以及对材料的合成提供依据。但由于高质量的In P/Zn S量子点的合成起步较晚,目前关于In P/Zn S核壳量子点光学物理特性方面的研究报道的较少。为了进一步研究In P/Zn S量子