基于深度神经网络的视频行为识别方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:Lxue_hlp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着监控摄像头的普及,基于视频数据的安防需求进步一步扩大。为了充分利用这些基础设施作为感知器官的能力,基于视频数据的行为识别成了学术上的研究热点话题。对于无人驾驶领域,针对道路上行人行为分析也是一个重要的难点,在该场景下的行为识别有助于提高汽车的防风险系数。行为识别不仅在安防,无人驾驶领域具有重要作用,在家庭服务机器人领域同样具有研究价值。随着世界范围的老龄化时代到来,家庭服务机器人市场也逐步开始扩大,为了更好的服务人类,机器人对人的行为分析就提出了更高的要求。由此可见,基于视频的行为识别在很多现实场景下有着大量的需求。通过对行为识别算法的研究,使得机器更加自动化,智能化,给安防,无人驾驶,服务机器人等行业带来实际价值。同时,随着深度学习在各个领域取得了巨大成就,并且得益于深度神经网络强大的特征学习和特征表达能力,深度学习在行为识别也取得了理想的成效。因此,本文提出使用基于深度神经网络的视频行为识别算法。本文的主要工作包括:(1)阐述了基于视频的行为识别的意义,充分调查研究了基于视频的行为识别算法的研究现状,对基于传统特征的行为识别算法和基于深度学习的行为识别算法进行了总结和分析。(2)针对局部空间特征缺乏判别性和时序特征低效单一的问题,本文提出了一种基于混合空间注意力和层次时序聚合的行为识别算法。具体表现为,针对局部空间特征缺乏判别性问题,提出了局部空间注意模块(Spatial Attention,SA)用于在2D-CNN提取的高层语义特征基础上增强其局部判别性。针对时序特征低效单一问题,提出了层次时序聚合模块(Hierarchical Temporal Aaggregation,HTA)在多个时序尺度上聚合时序信息并组合为富尺度时序特征,增强2D-CNN模型的时序建模能力。局部空间注意力模块和层次时序聚合模块共同组成了混合空间注意力和层次时序聚合模块(Mixed Spatia Attention and Hierarchical Temporal Aaggregation,MSAHTA),该模块可灵活的嵌入存在的2D-CNN行为识别模型,增强其空间表达能力和时序关系建模能力。在UCF101,HMDB51等数据集上进行了大量的分析实验,验证了所提出方法的有效性。(3)针对直接帧间差分导致的背景噪声问题和网络浅层时序建模不充分问题,本文提出了一种基于时序显著性集成的行为识别算法。具体表现为,针对由于摄像机的运动带来的背景噪声问题,提出了显著运动激励模块(Salience Excited Motion,SME)。SME的目标是通过局部-全局运动建模突出运动敏感区域,在相邻帧之间依次进行背景抑制和金字塔特征差分,以较少的背景噪声捕获运动动态。针对网络浅层时序建模不充分问题,提出了跨尺度时序集成模块(Cross Temporal Intergation,CTI)。CTI通过一组独立的一维卷积分别进行多尺度时序建模。同时,不同尺度的时序交互作用与注意机制相结合。整合SME和CTI构成时序显著性集成网络(Temporal Salience Intergratio,TSI),对长-短时序关系进行编码。在几种常用的基准数据集(即Something v1&v2、Kinetics-400、UCF-101和HMDB-51)上进行了大量的实验,证明了本文方法的有效性和优越性。(4)针对本文提出的基于混合空间注意力和层次时序聚合的行为识别算法和基于时序显著性集成的行为识别算法,设计并实现了基于深度学习的行为识别算法框架,辅助研究人员快速完成算法实现,同时方便开发人员进行项目实现。
其他文献
近年来,钢材生产工艺的提高带来了高强度钢材更广泛的工程运用。钢材设计强度的提高缩减了钢结构构件截面面积,使得受压构件的承载力由稳定性控制而非强度控制的特点更为显著。传统的构件局部屈曲理论为有效截面法,新兴的局部稳定设计理论如直接强度法与连续强度法在高强度焊接截面构件中的运用有待探索。为了进一步给高强钢构件设计提供参考,本文基于高强度钢材焊接箱形截面短柱的轴压试验,结合大量数值模拟工作,对高强度钢材
随着我国经济以及城市化进程的快速发展,高速公路、高铁等交通基础设施建设不断完善,这些交通基础设施的结构物在使用过程中,受环境影响不可避免地产生损伤累积,从而导致各种性能参数衰减,形成一系列的灾害隐患,如不及时发现和处理将严重威胁人们的生命安全。结构物应力应变等参数的自动化监测也因此受到越来越多的重视。本文基于全相位FFT(All Phase FFT,AP-FFT)算法,结合振弦数据采集的工程需求,
双离合器自动变速器(Dual Clutch Transmission,DCT)不仅具备换挡速度快、传动效率高、燃油特性好以及换挡冲击小、换挡平稳等优点,还具有能够保持换挡动力连续不中断等优点。在保证整车动力性和燃油经济性的同时,满足人们对驾乘平顺性和舒适性的要求。而离合器在服役过程中产生的摩擦磨损,导致离合器性态发生变化,影响双离合器自动变速车辆的起步和换挡质量,因而需要重点关注。目前,对于双离合
交错桁架钢框架结构体系具有重量轻、内部空间大和用钢量少等优点,是一种很适合用于装配式建筑的结构体系。为提升交错桁架结构的抗震性能,并在一定程度上避免结构体系出现薄弱层破坏,本文将交错桁架结构的柱采用通过柱肢间消能连杆耗能的双肢消能柱,形成消能柱-交错桁架结构,然后对该结构的抗震性能进行有限元分析。主要研究内容和成果如下:(1)分别建立有限元模型验证消能柱以及三节间桁架单元的试验结果,有限元分析结果
近年来,交通安全问题以及交通拥堵问题十分严重,为了监测汽车健康状态、道路交通拥堵状况,本文研发了一套基于智能终端的车路协同监控系统,主要研究内容及成果如下所示。首先,本文总结了车路协同技术与数据采集终端的国内外发展现状,并设计了车路协同监控系统的总体框架,总体框架主要包括车载终端、路侧终端、车位终端三部分。归纳了在研发车路协同监控系统过程中所用到的关键技术,包括CAN总线技术,OBD接口技术,4G
河南省一直以农业大省著称,粮食产量稳居国内第二,玉米在河南省是仅次于小麦的第二大主粮。近年来,河南省的玉米产量不断增长,由2009年的1752.91万吨增加到2018年的2351.38万吨,玉米产量在全国的占比维持在8.36%-10.12%区间内,河南省是我国重要的玉米生产大省。然而,自2015年来,河南省出现玉米种植收益连续为负的现象,玉米生产的收入风险突出,传统的产量基本保险已不能满足农户的风
目前,我国人口老龄化问题越来越突出,老年人口数量进入快速增长阶段,给我国的经济和社会发展带来严重影响,养老负担加重使得我国的养老保险制度可持续发展面临巨大挑战。与此同时,在“减税降费”背景下,政府提出城镇企业职工基本养老保险缴费率由19%下降到16%,以减轻企业负担,激发市场活力,在人口老龄化加重的背景下进一步下调缴费率,无疑对城镇职工基本养老保险的发展提出了更高的要求。一方面,降低税费减少了养老
中国出口集装箱运价指数(China Containerized Freight Index,CCFI)是全球唯一的用于反映集装箱运价的指数,该指数不但客观、及时地反映了中国集装箱运价的整体水平,而且量化了我国集装箱航运市场的变动情况,对货物贸易的运输成本有着重要的影响,是我国航运市场的“晴雨表”。做好对该指数的影响因素分析和预测有利于航运业以及政府及时掌握集装箱航运市场的运价动态,科学做出规避航运
航空货运具有时效性高、全球通达性强、承运货物价值高等特点,是物流运输中不可或缺的一环。在我国电子商务和快递业快速发展的背景下,我国航空货运具有巨大的发展潜力、在物流运输中的重要性愈发凸显。但是,目前我国航空货运网络存在抵御风险能力差的问题,严重影响我国航空货运的正常发展。因此,为提升我国航空货运网络的鲁棒性,保障我国航空货运的正常运行和健康发展,提前建立防范措施具有十分重要的意义。基于以上背景,论
现代煤化工产业的规模在逐年扩大,但还存在一些制约因素,其中水资源和水处理问题一直阻碍着煤化工的发展。煤化工每年不仅在生产上消耗大量新鲜水,而且还会产生近10亿吨的废水。废水具有差异性源于不同煤种以及煤化工生产过程,固定床煤气化废水是一类含高浓酚氨的废水。现有的煤化工废水处理流程除对氨的回收净化有所不足外,还常因为在酚氨回收工段出水中酚的含量过高从而影响后续生化处理。本论文以内蒙古某厂的煤气化废水为