基于深度学习的视频行为识别和检测方法研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:jerryweimao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频行为识别和检测是视频理解中最重要的任务之一,且在日常生活中有着广阔的应用前景。过去的几年,深度学习技术的引入使得该课题有了全新的进展,但由于视频数据的复杂性以及人体行为本身的不确定性,构建高效的识别或检测模型仍存在困难。本文深入研究了基于深度学习的行为识别和检测方法,对现有方法中存在的一些不足进行了改进,论文的详细工作如下:第一、提出了一种改进自TSN模型的行为识别方法。针对TSN网络各个采样分组缺乏关联的问题,设计一种遗忘门连接模块,使用LSTM的遗忘门结构用来建立每个分组之间的特征级连接,从时间维度上整合采样组,以增强各个采样分组之间的信息传输,提高时间维度的连通性。改进了空间流和时间流的特征融合方法,利用ConvLSTM连接特征提取网络:将上述双流网络的输出特征进行通道叠加,然后使用ConvLSTM学习特征的长期时空依赖关系,解决了以往双流+循环神经网络融合方法会破坏空间特征的弊端。经改进后的模型在UCF101和HDMB51两个数据集上进行了实验,结果表明,改进的行为识别方法相较于原始TSN算法有明显的提升,并且达到了与最新方法媲美的识别准确率。第二、提出了一种融合非局部模块的时空行为检测模型。模型采用一种双分支卷积神经网络的结构,用来解析视频的空间信息和时序信息。空间网络以视频单帧图像作为输入,对当前视频帧进行外观特征提取;时空网络输入视频帧序列来提取视频的时空特征。针对卷积神经网络对时域信息理解能力不足的问题,时空网络采用融合非局部模块的三维卷积神经网络来捕获视频帧之间的全局联系。为了进一步增强上下文语义信息,使用一种通道融合机制来聚合两个分支网络的特征,最后将融合后的特征用于帧级检测。模型在UCF101-24和JHMDB两个数据集上进行了实验验证,结果表明,模型能够充分融合空间和时间两个维度的信息,在基于视频的时空行为检测任务上具有较高的检测精度。
其他文献
近年来国内民航业高速发展,同时民航通信易受到非法电台等无线电设备发出的无线电信号所干扰,因此需进行无线电干扰排查。而传统上无线电干扰排查主要是申请无委进行协助排查,该方案存在成本高昂、对地面干扰源排查效果不明显、效率低下且无法对低空干扰源进行排查等显著缺点。另外,国内现有的低空无线电监测系统如DFA-1型等监测系统则存在载重限制大、监测时长低等缺点。因此本文旨在研究并搭建出一种在低空场景下对目标区
深海环境模拟伴随着潜艇技术出现而悄然兴起,经过多年的发展已经应用在不同的超深海装备开发中。人类的发展离不开资源开发,相比于陆地,海洋拥有更多的资源,所以海洋资源开发在当今世界已成为不可阻挡的趋势。超深海设备是人们获取海洋资源的工具,而超深海设备的研制离不开超深海环境模拟系统。超深海环境的因素种类繁多,如压力、温度、微生物和盐度等,现代模拟系统根据其目的设计出不同功用的装置来完成超深海环境模拟。本文
由于图像融合技术能够将不同图像中的信息整合到一幅图像中,因此图像融合技术的发展对于当前社会的信息分析技术越发重要,也因此其在科研领域中也有着重要的研究意义。多聚焦图像融合能够将一系列具有不同聚焦部分的图像进行融合。本文针对于多聚焦图像融合中存在的不同融合特点提出了三种不同的图像融合算法,主要工作描述如下:1.本文针对多聚焦图像融合中缺乏细节保护和结构不连续的缺点,提出一种基于图像卡通纹理分解和卷积
随着当前网络信息技术的飞速发展,招标行业和社会各界充分利用网络一体化的优势,为招标行业的发展提供便利。在此背景下我国道路工程发展迅猛,全国各地都在大力推广电子招标和投标,基于信息技术的电子招标打破了传统的在纸上记录信息的方法,具有精度高,效率高,成本低的优点。目前电子招投标技术在我国逐渐推广,由于环境、经济的变化和发展也给此新技术带来一些不可忽视的风险要素。招标工作作为发放和获取道路工程项目的主要
随着短视频应用快速走红和流媒体平台的兴起,视频影像已经成为人们日常交流的重要媒介,用户对影像质量的要求越来越高。为了解决硬件设备或网络传输带宽受限带来的图像降质,改善移动端设备或网页端应用的画质质量,常会使用图像超分辨(Image Super-Resolution,SR)算法来帮助提升用户体验。图像超分辨率任务通过对给定的低分辨率图像进行建模,学习从低分辨率空间到高分辨率空间的逆向映射,从而达到对
在大数据时代,各个平台都想利用数据信息基于推荐系统计算并更好的展示结果以获取收益。因此,如何更深的挖掘用户偏好已成为当下的研究热点。如今更多的算法模型层出不穷,研究表明,将辅助数据引入推荐系统是很必要的。近年来,由于知识图谱辅助数据全面,因此受到越来越多的关注。它通常以三元组的形式表示实体和实体间的关系语义信息,可以准确的表达用户与项交互的语义信息。通过探索在知识图谱中的内在联系,用户和项目之间的
随着超宽带无线通信技术的迅速发展,超宽带通信系统要求天线具备宽频带、小型化以及圆极化等特性。具有超宽带特性的天线可以满足超宽带通信系统的高传输速率需求;小型化天线有利于通信系统的内部集成;圆极化天线具备抗电磁及云雨天气、以及多径效应干扰等优势,可满足通信系统的稳定性需求。因此,本文针对天线的拓频技术、小型化技术以及圆极化技术开展了相关研究工作,主要内容如下:(1)针对通信系统对天线小型化及超宽带特
本文研究的微型电机转子焊点检测是和深圳A公司合作的一个项目。电机是智能门窗、家用电器、医疗器械等产品中的核心部件,其质量的好坏直接影响产品在的性能优劣,电机在制作工艺过程中焊点焊接部分在整个电机生产过程中占比较其他部分较大,其缺陷检测至关重要。传统电机转子焊点缺陷的检测主要依靠目视和检具,很难在精度与速度上满足工业在线生产的检测要求,所以制造一台焊点缺陷检测机是非常有必要的。根据A公司提供的检测标
太赫兹(THz)波独特的频段范围和频谱特性,使得THz技术成为现代科技、国民经济以及国防建设领域中研究的热点。随着THz技术的深入发展与广泛应用,对各类THz器件的研究提出了迫切的需求。超材料是一种新型的人工复合材料,具有负折射率、超高分辨率等奇异物理特性和超宽频谱响应,为太赫兹器件的发展提供了新的机遇。本文基于超材料,对THz吸波器、极化器和等离子体诱导透明(Plasma induced tra
区块链是一种分布式存储技术,具有去中心化、防篡改和可追溯等特点,能够有效解决信任问题。区块链不仅可以应用在数字货币,而且在金融、医疗、物流和跨境支付等方面也有广阔的应用前景。其中,联盟链中节点加入需要通过认证,其网络环境相对稳定可靠,因此许多商业应用更加偏向使用联盟链。但是现有的联盟链共识算法依然存在异常和安全问题,因此如何使共识算法安全高效的执行是如今急需解决的问题。PBFT是联盟链常用的共识机