【摘 要】
:
人体行为识别是计算机视觉的前沿研究课题,可应用在智能视频监控、人体行为分析和视频检索等领域中。近年来RGBD视频的出现为人体行为识别带来了新的机遇和挑战。在系统梳理RGBD视频的人体行为识别技术基础上,本文发现目前的研究存在如下问题:特征维度高、缺乏判别力部位分析、深度学习网络缺乏可解释性、特征融合难。因此本文分别针对上述问题,围绕着如何有效表示人体的动作特征展开研究,具体的研究内容和创新点如下:
论文部分内容阅读
人体行为识别是计算机视觉的前沿研究课题,可应用在智能视频监控、人体行为分析和视频检索等领域中。近年来RGBD视频的出现为人体行为识别带来了新的机遇和挑战。在系统梳理RGBD视频的人体行为识别技术基础上,本文发现目前的研究存在如下问题:特征维度高、缺乏判别力部位分析、深度学习网络缺乏可解释性、特征融合难。因此本文分别针对上述问题,围绕着如何有效表示人体的动作特征展开研究,具体的研究内容和创新点如下:1、针对特征维度高和缺乏语义解释的问题,提出了一种基于随机森林袋外估计的判别力部位挖掘方法。该方法首先将各关节点部位的特征分别送入不同的随机森林分类器,得到各行为和整个数据集上的袋外估计错误率;其次,从各行为和整个数据集的角度,将关节点按错误率从低到高排序,得到各关节点的判别力排序表,再通过阈值比较,得到各行为和整个数据集的判别力部位,发现各行为中关键的特征所在。在MSRAction3D数据集上的实验表明:本文提出的方法在不损失准确率的前提下,大大降低了特征维度,且能挖掘出各行为的判别力部位,具有一定语义解释性。2、针对真实场景下的实时性和强判别力需求,提出了一种基于部位元动作的人体行为特征表示方法。该方法将工作1的判别力部位结果与聚类技术结合,首先引入单关节点部位的动态聚类,采用关节点判别力来动态确定聚类中心个数,将判别力强的部位聚类个数增大,反之亦然。再引入判别力部位整体聚类,选出高识别率的判别力部位,将每个判别力部位内所有的关节点视为一个整体,串联特征后聚类,得到新的元动作。对于给定的样本,某个部位的元动作特征定义为该部位基础特征与各聚类中心归一化欧式距离的串联。最后,分别采用单关节点部位动态聚类和多判别力部位聚类的元动作特征来表示行为。在MSR Action3D数据集上的实验表明:元动作特征表示能有效识别行为,且能高效降维,可用于实时场景中。3、针对现有多特征融合方法维度高和计算复杂的不足,提出了一种基于特征分类熵的多元特征选择方法。该方法考虑了三种单元特征:判别力部位的HON4D特征(DP-HON4D)、基于判别力部位DMM的卷积神经网络特征(DPDMM-CNN)和关节点运动位移(JM)特征,其中前两种特征侧重表观信息,JM特征侧重运动变化信息。特征选择时,首先采用随机森林分别训练各关节点的HON4D表观特征,计算各随机森林分类器的平均分类熵。其次,测试时先将样本的各关节点HON4D特征送入对应的随机森林分类器,计算样本的分类熵,统计所有关节点中低于对应平均分类熵的个数,超过一定阈值时采用表观特征,否则采用其他特征。在MSR Dailly Activity 3D数据集上的实验表明:本文提出方法能根据给定行为的特点进行多元特征选择,准确率比单元特征方法提升明显,与其他特征融合方法相比,算法简单且维度低。综上所述,本文从行为识别中存在的维度高、缺乏语义解释等问题出发,提出了基于随机森林袋外估计错误率的判别力部位挖掘方法,并进一步应用在关节点特征聚类、深度网络结构和多元特征选择中。在RGBD通用数据集上的实验结果表明,本文提出的方法能有效降低特征维度,并且能体现出行为间的类内变化和类间变化,给多特征融合等技术提供了借鉴,有利于促进识别、特征处理和分类等技术的发展。
其他文献
证言知识论是当代知识论中极为重要的研究领域,如今许多有关知识的讨论都不得不涉及对证言的考察。因为在现实中,每个人的大部分知识来自于他人的证言,通过证言获得知识是非常普遍的现象。然而人们究竟如何通过证言而形成知识?或者证言是如何得到确证或辩护的?这一问题是证言知识论的核心问题。本文就是围绕着这一问题而展开。本文主要分为两大部分:第一部分集中于对已有确证理论的分析,并指出它们的不足;在第二部分中,在重
十九世纪后半叶以来基督教传入生活在中国西南及东南亚北部地区的众多跨境族群中,致使群体性皈依基督教之现象频繁出现。其中傈僳人受基督教影响之大,在中国境内少数族群中或在中国西南及东南亚北部地区皆为典型。云南傈僳人基督教信仰之源头,最先群体性皈依基督教的滇西南花傈僳人即为本文的研究对象。做为清王朝统治资源的一部分,滇西花傈僳人得以聚居在临近中、缅贸易通道的高地,在二十世纪初内地会传教士成为滇西以中、缅贸
氮化物发光二极管(Light emitting diodes,.LED)在21世纪初取得了重大的突破,在通用照明领域取得了广泛应用,并逐渐取代白炽灯和日光灯,成为节能环保的利器。目前制约InGaN基LED在大功率领域应用的一个重要因素为大电流注入下的效率衰减(Efficiencydroop)现象。虽然有许多物理机制试图解释该现象,但由于缺乏直接观测手段,该问题的物理起源仍存在争议。高A1组分AlG
陈太宗是越南陈朝开国皇帝,不仅被认为是一位“宽仁大度,有帝王之量”君主,同时也是越南第十三世纪著名的佛学思想家。本文以陈太宗所著之《课虚录》为主要文本,对陈太宗佛学思想进行全面而系统地深入探讨研究,梳理并概括陈太宗佛学思想之主要内容。除了绪论和结语之外,正文分为四章,另有两个附录列于最后。在概述陈太宗的时代、生平、佛学著述以及海内外学界对陈太宗佛学思想的研究动态之后,从体、相、用三个角度来阐述其“
神经机器翻译是采用端到端深度学习框架进行机器翻译的方法。近几年来,神经机器翻译取得了飞速的进展以及巨大的成功。由于神经机器翻译能够更好地建模长距离依赖关系,它已经取代了传统的统计机器翻译,成为了目前学术界和工业界最佳的机器翻译方法。主流的神经机器翻译模型一般使用词级别的序列来编码句子。然而,对于神经机器翻译的编码而言,这可能不是最佳选择,尤其是针对拥有歧义切分的语言而言。一方面,切分错误可能对神经
目前,随着人们对海洋深入探索的需求不断增加,对于水下通信系统传输信息的需求大大增加,且对水下通信系统传输信息可靠性的要求越来越高。然而由于水声信道(UnderwaterAcoustic Channel,UAC)存在复杂多变的强多径、严重的多普勒效应和噪声干扰,会引起传输信号的畸变,所以需要对水声信道产生的影响进行补偿,以增强水声系统的鲁棒性。本文主要是对基于水声正交频分复用(Orthogonal
随着互联网信息时代的到来,电子信息已经成为当今社会沟通与交流的主要载体。在这种环境和现实需求下,对电子信息的数字签名也开始变得尤为重要。数字签名技术由于具有身份认证性、数据完整性、不可抵赖性等等优势,使得它在信息安全领域扮演着重要角色。数字签名也随着用户的具体需求而产生各种特殊签名。比如代理签名方案是原始签名者因某种原因不能签名而将签名权利委托给代理签名者的数字签名方案。环签名方案是签名者想要达到
在很多应用场景中,无线传感器网络监测目标的相关信息需要不断地从网络中的源节点发送给汇聚节点,并且需要在网络中保持匿名,以达到网络安全和监测目标安全的目的。因此,源节点位置隐私保护是无线传感器网络领域中的一个重要研究课题,基于不同的敌手攻击模型,研究人员已经设计了多种源节点隐私保护方案。为了进一步提高源节点隐私保护效果并降低网络能量消耗,在本文中,我们提出了基于秘密共享的全方位源节点隐私保护方案(S
随着数字多媒体技术的发展,各种视频处理工具日渐普及。借助于这些视频处理工具,人们可以很方便地对视频进行编辑或对视频内容进行篡改,如果这种被篡改的视频被非法使用,其后果甚至会影响社会稳定。因此,如何对数字视频进行真实性和完整性的鉴定,已经成为当前多媒体信息安全领域中极为重要的研究课题之一。与数字图像相比,数字视频数据的海量、高维、非线性等特点给视频篡改取证技术研究带来更大的挑战。尽管国内外已有不少学
人体行为识别是指根据给定视频,利用机器学习和计算机视觉中各种方法自动分析视频中人的行为动作类别。行为识别容易受视频复杂背景、光照变化、行为人完成动作的速度、视角变化和部分遮挡等因素的影响,导致行为动作的类间与类内的模式变化大,使得人体行为识别成为目标识别中的难题,也是当前计算机视觉领域中的研究热点。人体行为识别的研究成果可以应用于智能视频监控、视频检索、人机交互等领域。因此,开展视频中人体行为识别