基于视频表示和深度神经网络的视频行为识别方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zj8972108
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和5G等技术对通信技术的发展,人们依赖以视频为载体进行信息传播方式的需求得到满足,视频多媒体越来越成为人们生产和生活中信息交流的主要方式。随着视频数据的快速增长,对视频信息的智能处理和智能感知成了迫切和重要的需求,基于视频的行为识别技术作为核心技术之一成为了研究的热点。深度学习作为一种人工智能方法,由于近年来展现了从数据中自动学习特征表示的能力,尤其在自然图像任务上精度的大幅提升,成为了计算机视觉研究的主流方法。本文主要基于深度学习算法,通过研究如何学习更好的视频表示,使得基于视频的行为识别任务能够有精度提升。主要工作包括:(1)视频场景能分为前景和背景,其中运动行为主体属于前景,主体的行为类别又和背景环境相关。视频包含的这两种信息有不同的统计特征,但共同决定行为类别。基于这种观察,本文提出了一种基于前背景分割与双通道网络融合的行为识别算法。算法首先按照时域分割的思想,将视频分解为多段,从每段中选择一帧。然后算法通过前景分割算法将视频中的信息分解为前景和背景两部分,分别输入空间流和时间流的残差网络,最终融合分类结果。证明了利用前景信息能有学习有效的视频表示,算法能获得较高的精度。(2)上述算法精度较高,但在推理时依赖计算前景信息,产生额外开销。三维卷积神经网络能够直接从视频流中获得视频表征,但是模型泛化能力差。本文具体分析了网络结构和参数初始化方法对三维卷积网络性能的影响,说明了参数初始化能提高模型的泛化能力。并提出了一种基于三维自编码器的无监督视频表示学习方法。首先使用三维卷积模型构造编码器,使用三维转置卷积和线性插值算法构造解码器,然后使用三维自编码器同时对视频帧的序列进行重构和预测。实验证明,算法能够帮助三维卷积网络获得更好的视频表示,提高后续基于视频的行为识别任务的精度,是一种有效的无监督视频表示学习方法。(3)深度学习领域对于视频表示的学习常使用端到端训练的方式,而缺乏具体的物理意义。在上述算法的基础上,本文提出了一种基于光流一致性假设的无监督视频表示学习算法,使网络学习有物理意义的假设来提升网络泛化性能。首先使用三维卷积模型构造自编码器;将光流看作相邻帧之间的图像变换,并使用自编码器学习这种变换。具体地,使用连续视频序列的奇数帧序列作为输入,使用三维自编码器预测偶数帧序列,使用对抗训练来衡量预测和真实光流变换的帧序列的差距。当模型收敛的时候,对抗训练达到均衡状态,从而隐式地学习光流一致性假设。实验证明,本章算法能够不依赖大规模数据集的预训练参数也能帮助三维卷积网络获得好的视频表示。算法相比已有的无监督和自监督算法有性能上的提高。
其他文献
在我国,公务员是拥有较高素质的队伍,是保障政府管理效力和执行力的基础力量,是保障国家发展并推动社会秩序良好运行的重要人力资源。激励是激发个体行为的过程,在组织的人力资源管理中至关重要。通过激励来激发工作热情,调动职工的主观能动性,从而使职工自发的全力工作,最终达到绩效目标。公务员激励在公务员管理中占有举足轻重的地位,组织通过激励来优化公务员个人工作行为,促使公务员积极提高工作效率,提升组织行政效能
随着阵列信号处理技术的快速发展,各领域对信号的测向精度要求越来越高,为了实现更高精度的信源估计,波达方向(Direction of Arrivals,DOA)估计就成了当前的研究热点。MUSIC(Multiple Signal Classification)算法、ESPRIT(Estimating Signal Parameter via Rotational Invariance Techniq
学位
学位
近年来可穿戴设备的发展一日千里,且在当今5G技术即将普及的大环境下,可穿戴设备更是大有可为。可穿戴设备对材料的柔性提出了要求,超级电容器作为循环稳定性好、功率密度高
石墨烯作为二维层状材料的代表,因为优异的热传导、高载流子迁移率等特性得到大量关注,并在电学、光学、电化学和生物医学等领域有着广泛的应用,除石墨烯以外,过渡金属硫族化合物(TMDs)作为类石墨烯材料也是研究的关注点。在此之中,二维WS_2薄膜因为较低的有效电子质量,并且显示出较高的载流子迁移率或输出电流。目前深入了解WS_2薄膜的生长机制并可控地制备所需形貌的WS_2薄膜仍面临挑战,本文通过化学气相
21世纪以来,文化传播渠道日趋丰富,网络文学在互联网技术飞速发展的背景下异常繁荣,满足了广大国外读者对异域文学的需求,极大地传播了中国文化。本次翻译实践取材于中国网络小说作家阿耐的《都挺好》。2019年,该小说被改编为同名电视连续剧在各大卫视热播,但尚未有英译本面世。本次翻译实践所节选部分用词丰富,大量使用网络流行语、四字短语以及中国习语,中国人的言说方式独具一格,人物情感色彩浓厚,凸显丰富的中国
和谐平安的校园是民办中学师生共享的精神家园,也是社会各界共同的美好期盼。然而,民办初中内发生的欺凌事件让我们意识到现实的学校场域并非我们构想的那么美好,一件件不和谐的欺凌事件要求我们必须高度重视民办初中内的校园欺凌问题。诚如我们所知,教师是民办中学校园欺凌的主要干预者,是有效防治校园欺凌的关键所在。那么,在实践中,民办初中教师治理校园欺凌的现状如何?教师治理过程中是否存在问题呢?造成教师治理产生问
近年来,GaN基发光二极管(LED)由于耗能低、绿色环保、寿命长、尺寸小等优点引起了人们越来越多的关注,被广泛用于全彩显示器、交通信号灯、固态照明等领域,但是GaN基LED的发光效率仍需进一步改进,然而外量子效率低的问题仍需要克服,关键问题是如何解决GaN与空气界面存在的全反射角引起的光提取效率(LEE)低问题。本文围绕基于单层胶体晶体衍生纳米结构提高LED的发光效率进行研究,利用金属有机化学气相
学位