基于多路时空特征流CNN-LSTM模型的行为识别研究

来源 :四川师范大学 | 被引量 : 0次 | 上传用户：ligc66

【摘要】

：

【作者】

：

康海承

【出处】

：

四川师范大学

【发表日期】

：

2020年01期

【关键词】

：

行为识别计算机视觉 CNN-LSTM 人体骨架图多模态融合

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

人的不安全行为是生产过程中事故发生的主要原因之一,传统视频监控系统依靠人力无法及时有效地发现作业人员的不安全行为,采用基于计算机视觉的行为识别技术,可以自动、非接触地识别监控视频中作业人员的行为,提高视频监控系统的工作效率和准确性,减少人因失误造成的事故。现有基于计算机视觉的行为识别方法,对兼顾行为视频空间特征和时序特征提取的问题上存在不足,难以充分利用行为视频的空间外观信息或帧间时序信息,输入数据类型较为单一,通常只考虑原始视频帧和光流图。为了提升现有行为识别方法的准确率,本文选择基于深度学习的方法以获得更强的特征提取能力和模型泛化能力,并使用CNN-LSTM模型对视频行为的视觉外观信息和时序关系进行建模。通过分析CNN-LSTM行为识别相关文献,确定了提升行为识别准确率的两个研究思路,即输入数据类型和模型时空建模能力,据此研究了以下内容:基于视频人体骨架图和CNN-LSTM的行为识别模型。为了增加可与现有模型输入数据信息互补的新模态,本文在原始视频帧中提取了人体行为骨架图,用于表征视频中人的姿态和运动变化;本文使用CNN-LSTM模型以同时利用骨架图的帧内视觉空间信息和帧间时序信息,为了更有效地提取行为视频的空间特征,采用inception V3取代现有方法中使用的卷积神经网络,间接增加了CNN-LSTM模型的整体性能。基于多路CNN-LSTM融合模型的行为识别。为了使原始视频帧、光流图、人体骨架图的能够有效信息互补,建立多模态的多路CNN-LSTM模型,并采用加权融合、自适应融合等多种模型后期融合策略,使多模态输入数据能够信息互补,提升行为识别准确率。最后在Caffe深度学习建模平台上对inception V3空间特征提取性能、CNN-LSTM模型对骨架图的识别性能、多模态CNN-LSTM模型的识别性能进行实验验证。实验表明,inception V3网络可有效提高行为视频的空间特征提取能力,CNN-LSTM模型可有效识别基于骨架图的行为视频,增加骨架图后的多模态CNN-LSTM模型能提高现有CNN-LSTM模型的行为识别准确率。

其他文献

滋墨对彩色复制的影响

自有印刷技术产业以来,印刷业者的主要任务始终是复制原始资料:照片、图像、文本或这几项的结合而形成的资料.因此,不仅印刷的内容要与原始资料一致,而且格式、颜色、版面安

期刊

彩色复制滋墨现象印刷质量仪器测试图像分析仪

地理特性植物-青蒿及松木的热解过程中金属元素迁移研究

本文针对生物质资源得不到合理利用,以及生物质资源处理处置不当而引起环境污染和资源浪费等问题,利用热解技术对生物质进行处理以提高能源利用率。为了寻找合适的热解工艺参数,将金属最大程度地富集于热解炭中,减少其在液相产物中的含量,提高焦油的开发利用率。选取西北地区尾矿库复绿植物松木和尾矿坝周边植物青蒿两种不同生物质进行热解试验,对不同生物质热解过程中金属元素的迁移进行研究。通过热重分析分别研究其热解特性

学位

生物质热解金属元素迁移富集

发挥保险业精准扶贫精准脱贫作用

“十三五”时期是我国全面建成小康社会决胜阶段。确保现行标准下农村贫困人口实现脱贫，贫困县全部摘帽，解决区域性整体贫困，这是一场时间有限的硬仗。$$长期以来，扶贫工作主要是

期刊

为金融创新找到突破口

国务院印发的《关于开展农村承包土地的经营权和农民住房财产权抵押贷款试点的指导意见》提出，稳妥有序开展“两权”抵押贷款业务，有效盘活农村资源、资金、资产，增加农业生产中

报纸

H共享单车企业的营销策略研究

自2014年第一辆OFO共享单车出现在公众视野起,短短几年间迅速蹿红成为人们短途出行的重要选择。然而,共享单车行业竞争异常激烈,如何发挥自身优势,通过制定切实有效的营销策

学位

H共享单车企业共享单车营销策略

MLQP神经元网络的学习算法及其典型应用

论述了一种多层二阶神经元MLQP(MultilayerQuadraticPerceptron)网络模型的结构和学习算法。这种模型综合了一般多层神经元网络和高阶神经元网络的特点,其结构简单,可调整权

期刊

神经元网络学习模式分类函数逼近

基于多路时空特征流CNN-LSTM模型的行为识别研究

其他学术论文