【摘 要】
:
目前,随着视频数据量的急剧增加,视频流量逐渐占据互联网流量的90%以上,如何使计算机自动高效地利用视频中的有用信息,也随之成为了学术研究热点。在丰富众多的视频中,以人的
论文部分内容阅读
目前,随着视频数据量的急剧增加,视频流量逐渐占据互联网流量的90%以上,如何使计算机自动高效地利用视频中的有用信息,也随之成为了学术研究热点。在丰富众多的视频中,以人的行为动作为主体的视频又占据了绝大多数。因此,研究视频中人的行为识别方法具有重大意义。大多数视频行为识别方法可以分为以下四类:基于时域、空域特征的双流法、基于3D卷积的卷积法、基于多帧图像输入的LSTM方法和基于提取人体骨架信息的姿态估计算法。其中,双流法自被提出以来,一直备受关注,而这其中经典的TSN(时域分割网络)由于简洁清晰的网络结构和较高的分类精度,是很多新型网络的基本架构。但同时,双流网络所要求的手工设计光流特征,计算繁琐费时、存储要求高,于是有人提出基于压缩视频的视频行为识别方法,直接从码流中读取运动矢量作为时域特征,这种方法虽然速度大大提高,但是由于运动矢量中蕴含大量噪声,在精度上不及光流作为时域运动特征的方法。因此,本文提出基于运动矢量的行为识别方法,首先复现测试TSN网络的模型结构与实验结果,然后类比光流网络实现一个提取类运动矢量的子网络,之后,将子网络嵌入到TSN网络中,研究测试不同超参数下、不同尺度融合方法下、不同光流与运动矢量融合技术下,网络的行为识别精度。最终得到较好的实验结果,超过了仅光流和仅运动矢量的行为识别方法,证明运动矢量与光流的多尺度融合是更好的时域运动特征,有助于网络进行行为识别。
其他文献
随着经济的飞速发展,私家车数量的逐年攀升导致了城市道路容量接近饱和状态,随之而来的交通拥堵问题也成了城市道路的一种亟待解决的问题。解决交通拥堵问题,完成道路交通的
随着移动通信的飞速发展,移动网络中接入的智能设备数量与日俱增,对于网络承载能力和容量的要求也越来越高。各种服务和移动应用对于实时性的高要求,使得移动数据网络面临着
目前,我国的尾矿难以得到综合利用,利用率仅有7%,其中的大量有用元素被浪费,难以得到有效循环使用。由于鞍山地区的尾矿中硅含量和铁含量比较高,利用铁尾矿制备尾矿微晶玻璃,
随着现代科技的不断发展,显微设备以其超高分辨率在人类认识微观世界中发挥了巨大作用。然而,在图像采集与记录过程中,由于设备暗电流、样品物理性质以及操作人员的主观判断
精准农业是一种现代化农业理念,能够提高生产、减少投入,实现农产量的最大化、资源利用的合理化、环境污染的最小化,从而达到改善传统农业缺点的目的。无线传感器网络是实现
近年来随着电子商务的飞速发展使得越来越多的网络用户习惯在网络上发表自己对于某一事物的意见与评论,对这些评论所包含的情感倾向进行分析与判别可以创造巨大的商业与社会
近些年来,无线通信迅速发展的同时人们对数据业务的要求也越来越高,更大的数据量更快的传输速度对无线通信技术都提出了更高的要求。但无线信道完全开放的特性和存在衰落、覆
近年来人工智能和网络通信技术逐步发展,视频监控和图像处理技术的应用范围也相应扩大。传统的监控设备大多采用单一波段、固定位置摄像机,监控范围较小,在天况较差时使用红
我国境内分布着诸多大型汞矿,如贵州万山汞矿、陕西旬阳汞矿等,多年以来汞矿的开采和冶炼活动对当地的生态环境造成了严重的破坏,环境污染问题成为首要解决的问题之一。目前,
可视化分析作为文献计量学领域的一种重要的研究方法,通过可视化分析软件可以将某一领域中的文献客观、形象的展示出来,以此来挖掘其潜在的信息。本研究以2008-2017年Web Of