基于深度学习的红外人体目标检测与动作识别

来源 :浙江大学 | 被引量 : 0次 | 上传用户:qq273683019
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能手机和摄像设备的增加,图片视频等数据资源迅猛地增加。红外图像的数据量也随着红外设备的增多而日益增多,如何从这些红外图像和视频数据挖掘信息成为当今研究的热点。红外图像和视频在安防监控,视频检索,红外图像识别和人体姿态识别都有着重要的作用和巨大的潜力。越来越多的科学家和工程师研究和探索红外图像的检测和动作识别。针对上述背景,本文调研了目前动作识别的发展现状与难点,并分析了可见光动作识别的发展历史和出现的重要算法,也对红外动作识别的进展进行了调研,介绍了专门为红外动作识别提供的数据集InfrAR,以及目前在该数据集上的提出的识别算法进展。最后通过分析空间复杂性,时间差异性,计算资源等角度分析了动作识别的难点所在。文本介绍了深度学习基础理论,包括神经网络原理和结构。并分析了主流的几种基于深度学习的动作识别算法。在红外人体目标检测任务中,本文完成从模型训练到硬件实现的全部流程。本文找出并处理了 FLIR-ADAS的红外图像数据集,并使用dark-net训练框架对红外图像的人体目标进行训练,得到网络模型参数,然后使用英伟达的开源优化库TensorRT和DeepStream对网络模型进行加速处理,实现在Jetson Nano开发板上实时25帧的红外车辆和行人检测模型。本文还分析了 YOLOv3和tiny-YOLOv3的检测差异与实时性能对比。在红外目标的动作识别中,本文采用基于MPEG-4压缩视频提取运动帧的方法,直接从视频中提取关键帧(I-frame),预测帧(p-frame)和残差帧(residual-frame),并使用深度学习网络ResNet152,ResNet18对压缩内容提取运动信息,使用正则化的技术和增加视频分段数,可以抑制小数据集容易出现的过拟合问题,通过对视频分段数,模型融合的权重实验,反复训练和测试,找到最优的超参数,最终实现在InfrAR红外数据集实现61.67%的平均准确率,75.03%的平均精度均值(Mean Average Precision,mAP)。证明基于压缩视频的动作识别算法在红外领域有很好的实用性和适用性。本文讨论和实验正则化权重,模型融合比例,以及视频分段数与该模型的关系,量化对模型的影响,更好扩展算法的性能。
其他文献
进行高炉鼓风脱湿,可以降低高炉冶炼的工序能耗,稳定高炉冶炼工况,是企业节能降耗的重要途径。文章对鼓风脱湿的发展、对高炉冶炼的影响进行了详细的论述,并进行了脱湿系统的热平
集团客户与单一客户的特性有很大差异,商业银行在开拓利润的同时,也进入了一个未知的风险领域,商业银行应全方位地对集团客户制定和实施有效的授信业务风险管理措施,从而保障
<正>为应对日益加剧的老龄化和居高不下的慢性病高发态势,《"健康中国2030"规划纲要》指出,发挥全民科学健身在健康促进、慢性病预防和康复等方面的积极作用,推动形成体医结
高层公共建筑具有面积大、层数多、功能复杂等特点。以北京华业国际中心为例,介绍了设计过程中遇到的一些消防问题及解决方案,可供类似高层公共建筑消防设计时参考,避免火灾所造
土库曼斯坦天然气合作项目是目前中国石油天然气集团公司(以下简称中石油)最大规模的海外天然气勘探开发项目,中石油川庆钻探工程有限公司为其中的阿姆河右岸项目提供全方位的
松辽盆地徐深气田是中国石油大庆油田有限责任公司2002年发现、2005年探明的,主要气藏类型属于火山岩气藏。为了有效开发该类气藏,先后开展了露头勘测、密井网解剖以及长井段
2000年以来,中国石油天然气集团公司在鄂尔多斯盆地、四川盆地、塔里木盆地、松辽盆地、柴达木盆地、渤海湾盆地等的天然气勘探中不断获得新的发现,初步形成了东部、中部、西
中国南方志留系勘探程度较低,制约了对志留系自身油气成藏特点的研究和认识。从烃源岩的时空分布、优质烃源岩的发育环境、生烃史3个方面分析了中国南方上奥陶统-志留系的烃源
为了改善柴油的低温流动性能同时提高十六烷值,中国石化石油化工科研究院开发了加氢改质降凝技术及其RHC-130加氢改质降凝催化剂。研究结果表明,RHC-130催化剂对直馏柴油、催化