基于多路时空特征流CNN-LSTM模型的行为识别研究

来源 :四川师范大学 | 被引量 : 0次 | 上传用户:ligc66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人的不安全行为是生产过程中事故发生的主要原因之一,传统视频监控系统依靠人力无法及时有效地发现作业人员的不安全行为,采用基于计算机视觉的行为识别技术,可以自动、非接触地识别监控视频中作业人员的行为,提高视频监控系统的工作效率和准确性,减少人因失误造成的事故。现有基于计算机视觉的行为识别方法,对兼顾行为视频空间特征和时序特征提取的问题上存在不足,难以充分利用行为视频的空间外观信息或帧间时序信息,输入数据类型较为单一,通常只考虑原始视频帧和光流图。为了提升现有行为识别方法的准确率,本文选择基于深度学习的方法以获得更强的特征提取能力和模型泛化能力,并使用CNN-LSTM模型对视频行为的视觉外观信息和时序关系进行建模。通过分析CNN-LSTM行为识别相关文献,确定了提升行为识别准确率的两个研究思路,即输入数据类型和模型时空建模能力,据此研究了以下内容:基于视频人体骨架图和CNN-LSTM的行为识别模型。为了增加可与现有模型输入数据信息互补的新模态,本文在原始视频帧中提取了人体行为骨架图,用于表征视频中人的姿态和运动变化;本文使用CNN-LSTM模型以同时利用骨架图的帧内视觉空间信息和帧间时序信息,为了更有效地提取行为视频的空间特征,采用inception V3取代现有方法中使用的卷积神经网络,间接增加了CNN-LSTM模型的整体性能。基于多路CNN-LSTM融合模型的行为识别。为了使原始视频帧、光流图、人体骨架图的能够有效信息互补,建立多模态的多路CNN-LSTM模型,并采用加权融合、自适应融合等多种模型后期融合策略,使多模态输入数据能够信息互补,提升行为识别准确率。最后在Caffe深度学习建模平台上对inception V3空间特征提取性能、CNN-LSTM模型对骨架图的识别性能、多模态CNN-LSTM模型的识别性能进行实验验证。实验表明,inception V3网络可有效提高行为视频的空间特征提取能力,CNN-LSTM模型可有效识别基于骨架图的行为视频,增加骨架图后的多模态CNN-LSTM模型能提高现有CNN-LSTM模型的行为识别准确率。
其他文献
目的:了解康复治疗学专业学生专业英语学习和双语教学意愿,为双语教学工作提供信息和思路。方法:选取我校康复治疗学专业学生104例,其中大二学生43例(A组),大三学生61例(B组),自制调查
自有印刷技术产业以来,印刷业者的主要任务始终是复制原始资料:照片、图像、文本或这几项的结合而形成的资料.因此,不仅印刷的内容要与原始资料一致,而且格式、颜色、版面安
本文针对生物质资源得不到合理利用,以及生物质资源处理处置不当而引起环境污染和资源浪费等问题,利用热解技术对生物质进行处理以提高能源利用率。为了寻找合适的热解工艺参数,将金属最大程度地富集于热解炭中,减少其在液相产物中的含量,提高焦油的开发利用率。选取西北地区尾矿库复绿植物松木和尾矿坝周边植物青蒿两种不同生物质进行热解试验,对不同生物质热解过程中金属元素的迁移进行研究。通过热重分析分别研究其热解特性
“十三五”时期是我国全面建成小康社会决胜阶段。确保现行标准下农村贫困人口实现脱贫,贫困县全部摘帽,解决区域性整体贫困,这是一场时间有限的硬仗。$$长期以来,扶贫工作主要是
期刊
国务院印发的《关于开展农村承包土地的经营权和农民住房财产权抵押贷款试点的指导意见》提出,稳妥有序开展“两权”抵押贷款业务,有效盘活农村资源、资金、资产,增加农业生产中
报纸
自2014年第一辆OFO共享单车出现在公众视野起,短短几年间迅速蹿红成为人们短途出行的重要选择。然而,共享单车行业竞争异常激烈,如何发挥自身优势,通过制定切实有效的营销策
目的:观察局部肌肉注射A型肉毒毒素(BTX—A)治疗痉挛型脑瘫的疗效。方法:83例痉挛型脑瘫患儿分为观察组53例和对照组30例,均采用BTX—A局部肌肉注射和推拿治疗;观察组同时结合系统
本文主要探讨了三都水族自治县特色农产品知识产权保护与管理的问题,先分析了三都水族自治县主要特色农产品的产业现状,从历史渊源、产地范围、地理特征以及生产销售等情况来分
论述了一种多层二阶神经元MLQP(MultilayerQuadraticPerceptron)网络模型的结构和学习算法。这种模型综合了一般多层神经元网络和高阶神经元网络的特点,其结构简单,可调整权