面向视频的人体行为识别方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:qq12441483
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人民物质生活水平的不断上扬,以计算机视觉为基础的人工智能家具、家电等各种高科技电子产品与日常生活愈发地息息相关。而人体行为识别作为计算机视觉当中的一个重点研究领域,也同样被人们密切关注。本论文以面向视频的人体行为识别方法为研究课题,重点针对人体行为识别当前阶段亟待解决的关键性问题,如有效获取视频图像帧之间的时序信息、解决视频信息中的长时间依赖问题以及提高算法的准确性和实时性问题等,从以下两个不同的角度入手,进行了人体行为识别方法的研究。1.融合长短时间记忆网络和自注意力机制的人体行为识别方法。该方法首先将数据集通过提帧操作变成一个个的视频图像帧序列,然后对每个视频图像帧序列随机抽取连续的包含时间维度信息的数帧图像,并输入到网络模型中。其次,从两个方面来展开研究,分别采用了长短时间记忆网络模型以及在此模型基础上添加的自注意力机制改进模型,一步步来探究各个模型解决视频中的长时间依赖问题的能力,尤其是对于那些场景动态且人体行为复杂繁琐的长时间帧图像序列的行为识别。实验结果表明,不管是模型的准确率还是模型的预测能力,添加自注意力机制的改进模型的表现都更胜一筹。2.融合二维卷积与三维卷积的高效人体行为识别方法。该方法首先对视频的处理做出了一些改进,将提帧过后的视频图像帧序列分成N段,并从每段当中随机采样单帧图像,并将这N帧图像一同输入到网络中。之后,考虑到三维卷积也同样可以有效捕获时序信息,因此分别构建三维卷积模型以及融合二维卷积和三维卷积的串联模型和并联模型。实验结果表明,融合二维卷积与三维卷积的串联模型和并联模型在模型的准确率上都表现不错,并且由于其网络结构采用了BN-inception以及ResNet18-3D的优化组合以及训练模型中采用的优化策略,使得模型的实时性相比于普通的三维卷积模型有了较大的提升。最终,通过对本论文中所有模型与其他常用模型实验结果评价指标的对比,发现本方法中采用的串联模型和并联模型的准确性和实时性都是相对比较高的,这也有助于今后将其应用到工程领域。最后,通过对本论文所采用的人体行为识别方法进行总结和分析,提出今后需要改进的地方以及对未来该领域的发展作出相应展望。
其他文献
中国是抗生素生产大国,每年可以生产和出口大量的抗生素。在生产抗生素时,会产生大量的发酵残渣,这些残渣就是我们常说的抗生素菌渣。抗生素菌渣的含水率比较高,且含有抗生素
目前,上海市蔬菜出口在出口量和出口额、蔬菜产品结构、主要目标市场、出口的基本模式、遭遇的国外贸易壁垒类型等方面发生了变化,蔬菜出口行业面临着国外技术壁垒趋严、内销市
随着高温季节人们对大白菜需求的增加和耐热大白菜研究成果的推广应用,耐热大白菜生产面积逐年迅速发展,已成为高温季节和我国南部地区主要蔬菜之一。由于耐热大白菜生育特性导
以计算机并行口为基础.围绕MAX197设计了数据采集系统的硬件电路,并给出了具体软件,试验表明。该采集系统安装方便.运行稳定可靠,有较高的性能价格比。
医学英语词汇是医学专业信息的载体,是专业思维的传播工具,是医学交流的语言符号。在中外医学交流与合作日益频繁与紧密的今天,掌握医学词汇更显重要。文章针对多数医学专业
随着云计算技术不断发展,云环境下的安全问题愈发受到业界关注。最近的Rowhammer攻击打破了人们过去对于物理硬件的信赖,攻击者可以利用软件方法来触发DRAM内存中的硬件错误,
日前,国家发改委网站公布了《关于培育发展现代化都市圈的指导意见》。意见中出现了“放开放宽除个别超大城市(城区人口超过1000万的城市)外的城市落户限制”的字样。公安部副部
期刊
司法会计鉴定是一项重要的诉讼活动.然而,人们常常会将它与审计混同,不仅影响了对司法会计鉴定的准确理解,更重要的是影响到对司法会计鉴定的正确运用,最终影响到诉讼证据质
据“中国财经信息网,2005—03—08”报道,近日国际橡胶研究组织(IRSG)发布了2004年世界橡胶消费报告及2005、2006年展望。该报告指出,2004年世界橡胶消费连续第三年增长,估计将增
随着航空航天、装备制造以及电气工业等多领域的快速发展,对金属材料要求越来越高,应同时具备多种优异的金属材料性能。铜基复合材料的产生是为了解决常规强化铜手段不能满足其强度与导电性兼备的问题,通过引入第二相来对铜进行强化。高熵合金作为近几年发展起来的新型合金,具有高强度、高硬度和耐高温稳定性等特点,再加上与铜基体天然的金属-金属界面,高熵合金作为铜基复合材料的增强体具有研究价值。激光3D打印技术是近几