基于机器学习的行人姿态估计及识别的算法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户：heguojing514

【摘要】

：

【作者】

：

郑胜昌

【出处】

：

山东大学

【发表日期】

：

2020年02期

【关键词】

：

姿态估计行为分类深度学习卷积神经网络数据增强

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

视频行为识别的目的是自动检测并分类来自输入视频的正在进行的活动。它在监控,在线视频,运动分析等方面有很多应用。在某些特定的场景中,监控视频中的非正常行为是大家关注的重点,通过系统自动识别异常行为,工作人员可以及时的判断目标区域是否存在危险行为以及它的特点,从而防止恶性活动的进一步扩散及更恶劣后果的出现。视频行为识别是机器学习在安防领域的深入应用,这个产业也吸引着越来越多的研究人员和学者的加入。视频行为识别是指从视频序列中自动分类,其类别通常是人类行为,如步行,慢跑等。视频分析与图像分析最大的区别在于,视频序列包含额外的时间信息,所需的计算量通常要大得多。因此,当前人体行为识别算法的难点集中在这几点:1.如何提取有效的时间域特征和空间域特征是姿态识别和行为分类过程中最重要的问题;2.如何有效融合相同的空间域下和不同时间域下的特征,共同完成姿态的估计和行为的描述;3.为了满足实际应用的要求,算法的效率非常重要,即如何在保证特征提取能力的基础上缩小模型规模;4.网络在训练集上的分类结果非常好,但往往在测试集上的分类结果并不理想,即如何保证模型的泛化能力。这些问题限制了计算机模型自动完成视频中行为的识别,为智能监控、公共安全监督等实际应用带来的困难。本论文围绕上述问题提出了相应的解决办法,并通过实验完成了对算法效果的验证。人体行为识别任务是典型的分类问题,通常配合大规模的样本完成机器学习模型的训练以使其收敛。典型的一种样本是视频,其中包含着不同的人在不同时间下的在不同空间位置的多种行为,因此需要同时考虑单个行为的多种表达方式和多种行为之间的本质区别,换句话说,也就是样本的全面性和独特性,因此文本尝试了多种数据增强方式以观察其有效性。目前,对于基于视频分析的人体行为识别任务的研究仅仅到达了动作识别的层级。在这个任务中,行为对象包括两种:其一是满足某些特定规则的固定种类的简单动作,例如行走、慢跑、跳跃和下蹲;其二是具体环境下的特殊情形,包括不法分子的抢劫、偷窃、打架斗殴。在后者的环境中,人体作为非刚体,其动作和行为很难被准确的表征,因此往往通过采取跟踪其运动轨迹的方式进行判断。如今,以上两个小方向的研究仍面临着严峻的挑战,远不能满足实际应用的需求。针对这些问题,本文通过开发新的深度卷积神经网络架构来解决高级语义信息抽取的问题。另外,传统用来描述人体姿态和行为的特征难以抵抗噪声,以及视角的变化。本因此,文通过改善传统的训练方法来增强模型的鲁棒性,改善网络对噪声、遮挡和视角变化的抵抗能力。在视频分析领域,人体行为识别的研究逐渐成为备受关注。它具有广泛的应用和很大的实际意义。可以看出,大多数算法利用具有先验知识的深度卷积神经网络完成用于行为分类的视频序列的时空域特征的提取。在本文中,针对视频行为动作的类内类间变化太大,视频中复杂的环境背景因素(环境的变化,镜头的抖动等)的影响,高层次视觉的难以理解和表示等问题,在三个公共视频数据库上完成了对人体行为的分类,分类结果证明基于统计人体姿态信息的分类方法具有良好的效果。创新点主要包括:时空域特征的有效提取和描述,不同类别特征之间的融合(包括局部特征和全局特征融合、时序特征和空域特征的融合),基于多核支持向量机人体行为识别等。

其他文献

商品寿命周期成本在企业生产决策中的应用

我们通常所说的成本是从生产者的角度来说的,即是生产者成本。所谓的商品寿命周期成本是从消费者的角度来说的,即消费者购买商品和使用商品所发生的总费用,包括购买成本和使

期刊

企业生产决策寿命周期成本

义位分析的“框架—参数”模式

义位作为语义系统的基本单位,在词义研究中具有举足轻重的地位,但是对义位的分析却缺乏较为客观、科学、全面的方法.文章以“整合一体描写”原则、语义场词项属性分析理论、

期刊

义位框架参数

信息类型对大学生公共情绪的影响

本研究在文献研究的基础上,使用翻译的公共情绪量表(中文版)对在校大学生进行测查。本研究采用相关分析、探索性因素分析和验证性因素分析对量表进行信效度检验,并以此为工具

学位

公共情绪积极情绪消极情绪信息类型旁观者公众敏感性

护理干预对慢性萎缩性胃炎患者疗效及心理状态的影响

目的:探讨护理干预对慢性萎缩性胃炎患者临床治疗效果及心理状态的影响。方法:以2012年12月-2014年12月本院收治的60例慢性萎缩性胃炎患者为研究对象,将其随机分为观察组和对

期刊

护理干预慢性萎缩性胃炎心理状态

银丹心脑通软胶囊治疗慢性脑供血不足患者头晕和头痛的效果

目的观察银丹心脑通软胶囊治疗慢性脑供血不足患者头晕和头痛的效果。方法选取医院收治的慢性脑供血不足患者100例为研究对象,随机分为观察组和对照组,每组50例。对照组采用

期刊

银丹心脑通软胶囊慢性脑供血不足头晕头痛

Anger及其同义词概念隐喻模型研究

作为人类心理活动的一个重要方面,情感与认知密切相关。借助Sketch Engine和Word Net,本研究旨在英语国家语料库中探索anger,fury,rage和resentment的隐喻表达类型与概念隐喻模型的分布,并在此基础上归纳“愤怒”这一情感概念的隐喻模型,分析这些概念隐喻模型的认知动因。通过分析,本研究主要有以下发现:(1)在这四个同义词(anger,rage,fury和resentm

学位

情感隐喻语料库同义词对应分析

“一带一路”背景下的中非旅游合作

2013年之前中非旅游合作得到了政策支持,取得了一定的成就。“一带一路”背景下,中非旅游贸易得以畅通、旅游设施得以完善、旅游人才政策得以完备,中国重视文旅融合、非洲发

期刊

“一带一路”中非旅游合作中非合作论坛旅游系统合作框架

为什么要强调“不忘初心”

<正>王长江在2016年7月21日《经济日报》撰文指出,习近平总书记在庆祝中国共产党成立95周年大会上的讲话,提出了很多新的思想和观点,为进一步推进党的建设理论和实践提供了指

期刊

求职信写作略谈

<正>用语的直陈性从文体来看,求职信属于应用文范畴,其语体应该选用事务语体。从功用角度来看,求职信的目的性非常单一,能够表达清楚自己的情

期刊