基于视频的人体行为识别算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:nestle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于视频的人体行为识别在智能监控系统、基于内容的视频检索、人机交互等领域有着较为广阔的应用前景,是计算机视觉领域的前沿课题,也是一项十分具有挑战性的课题。本文从传统机器学习算法和深度学习算法两个方向对基于视频的人体行为识别展开了研究,本文主要研究内容如下:1.快速iDT算法。iDT算法是目前行为识别效果最好的经典机器学习算法,因此本文在对基于机器学习的行为识别算法的研究中采用iDT算法框架作为基本的算法框架。但是iDT算法需要提取密集光流,而密集光流的计算又十分耗时。因此,为了提高算法的处理速度,本文选用了计算耗时远小于密集光流且性能接近于密集光流的一种运动描述符,即基于视频压缩的运动描述符(MPEG Flow),以此替换iDT算法中的密集光流。2.基于时域分割的深度聚合网络。目前深度卷积网络在行为识别任务中仍然面临两个问题:1)网络不能对具有长时域结构的行为进行有效识别;2)网络无法有效描述行为子特征之间的相关性。针对以上问题,本文提出了一种端到端的双流网络,名为基于时域分割的深度聚合网络。网络主要由两个子网络组成,基于时域分割的深度网络与深度聚合网络。基于时域分割的深度网络,其作用主要是解决问题一。因为它采用了一种基于时域分割的视频帧采样策略,这使得它可以得到对整个视频片段覆盖较为充分的若干个稀疏视频子序列,每个子序列再通过一个双流网络进行特征提取。深度聚合网络,其作用主要是解决问题二。深度聚合网络的实现主要是引入了NetVLAD作为特征聚合层,对比最大池化、平均池化等其他聚合方式,NetVLAD更加专注于局部特征之间的联系。3.对基于时域分割的深度聚合网络的改进。本文尝试对算法进行两方面的改进,分别是引入注意力机制以及损失函数的改进。时空自注意力机制的引入主要是受到非局部神经网络(Non-local Neural Networks)的启发,引入该网络的目的是提升NetVLAD对于视频重要时空特性的捕获能力。之所以引入包含中心损失的联合损失函数,是因为该联合损失函数在另一种分类任务,人脸识别中发挥了积极作用,通过该联合损失函数可以学习到区分性更强的特征。
其他文献
突发通信系统(Burst Communication System,BCS)将信号设计为短时突发的形式,在时变信道中能够进行可靠的数据传输。随着电磁环境日益复杂,干扰设备和侦察设备能力日益增强,
近年来随着通信5G技术以及国内互联网产业的飞速发展,在智能视频监控、自动驾驶汽车、智能家居以及时下兴起的网络短视频等领域每时每刻都在生产海量的视频数据,如何更好地利
介绍了VaR方法和GARCH模型,并将GARCH模型与VaR方法相结合,对上证综合指数的风险值进行度量,并进行检验。结果表明金融时间序列不服从正态分布,而是有偏的,厚尾的,并且具有方差时变
本文运用改进前推回代潮流计算方法并引入电压及网损改善指标,研究了分散式风电接入后对配电网电压及网损的影响。研究风电机组类型不同时,接入不同地点时,以及是否装设无功补偿
采用动态硫化法制备了丁腈橡胶(NBR)/二元共聚氯醚(ECO)共混胶,研究了动态硫化温度、时间及不同丙烯腈含量的NBR对动态硫化胶性能的影响,对比了动态硫化胶和常规共混胶在性能
考察了以乙基四氢糠基醚(ETE)、乙氧基吗啉(EOEM)或四氢糠醇钠(THFAONa)作为改性剂,在改性剂与正丁基锂引发剂的摩尔比为1/1的条件下,对负离子聚合法合成的乙烯基聚丁二烯聚合反应速率
研究了在茂金属催化剂体系所用硅胶的制备过程中,反应体系中二氧化硅的浓度和溶胶-凝胶的反应温度对硅胶孔容及孔径的影响。结果表明,当SiO2的质量分数为9.2%、溶胶-凝胶反应温度
防止甜椒接种弱毒病毒后减产的措施在有TMV病毒为害的甜椒种植区,常用接种弱毒病毒的方法进行防治,但有时会出现产量和品质下降的问题。这是由于接种弱毒病毒以后的甜椒更易受到栽
结合武汉生物工程学院《动物细胞工程学》的教学实际,分析了该课程的教学现状,从教材、教学方法、实践动手培养、考核方式和师资力量等几个方面提出了一些改革措施,以期为该
水生蔬菜大多数起源于我国,或以我国为起源地之一,是我国的一类特色蔬菜,也是我国人民传统喜好的蔬菜种类,栽培利用历史一般在2000年以上。同时,我国水生蔬菜产品在国际农产品贸易