基于稠密轨迹和正则化多任务学习的人体动作识别算法研究

被引量 : 1次 | 上传用户:chiivy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于RGB通道的单视角动作识别容易受到诸多因素的干扰。例如:光照变化、视角变化和个体动作差异等因素。这些因素限制了其进一步的发展和应用。为了减少这些干扰因素的影响,多视角多模态以及动作间的潜在关联信息研究开始成为动作识别领域的新热点。基于这些发展趋势,本文的研究工作包括以下三个部分:1)在单视角条件下,提出了基于深度运动轨迹信息的人体动作描述算法;2)在不同视角条件下,评价与分析不同正则化多任务学习算法对动作识别的性能影响;3)在多视角条件下,提出了基于正则化多任务学习和图集的多视角人体动作识别算法。具体工作为:1)提出基于深度运动轨迹信息的人体动作描述算法。在深度视频图像上,该算法首先利用光流信息的变化去提取稠密轨迹特征,加入该特征的深度变化信息并将稠密轨迹的立方体分割成若干个子立方体;然后,计算相应的描述算子-HOG(Histograms of Oriented Gradients)和HOF(Histograms of Optical Flow),为了消除相机移动所带来的干扰,计算MBH(Motion Boundary Histogram)描述算子,将轨迹特征、HOG、HOF和MBH进行串联,利用K-means和BoW(Bag-of-Word)模型进行投影;最后,利用不同的支持向量机SVM(Support Vector Machine)进行分类。通过在两个公开深度动作数据集DHA-17和UTkinect的实验结果可知:该描述算法在深度数据上具有较好的实验性能。2)评价与分析正则化多任务学习算法对人体动作识别的性能影响。由于正则化多任务学习算法能够很好地挖掘不同任务之间的关联信息,所以本章将同一视角的不同动作视为不同的任务,利用多种正则化多任务学习函数来挖掘不同动作之间的关联信息并将它们的实验结果与单任务学习算法SVM的实验结果进行比较;此外,在跨视角识别上对该算法实施进一步的评估。通过在三个公共多视角数据集CVS-MV-RGBD-SINGLE、IXMAX、UCLA数据集上的实验结果可知:正则化多任务学习算法在单视角识别上具有一定的优越性和鲁棒性,能够在一定程度上挖掘不同动作之间的关联;此外,由于视角的差异较大,正则化多任务学习算法的性能受到制约,在跨视角识别上优势不明显。3)提出基于图集和正则化多任务学习的多视角人体动作识别算法。首先,为了验证多视角样本对多任务学习的影响,算法将不同视角下的训练样本进行叠加,挖掘不同视角下样本的关联信息;随后考虑到不同视角样本的相关性,将图集算法引入到多任务学习模型Least_RMTL中,进一步挖掘不同视角不同动作的关联信息,从而达到提高动作识别率的目的。通过在三个公共多视角数据集IXMAX、UCLA、CVS-MV-RGBD-SINGLE实验表明:多视角样本数量的增加对多任务学习算法性能具有一定的促进作用;同时,图集算法的引入使多视角样本之间的潜在关联特性得到了充分地挖掘,进一步的提高了多视角动作识别的性能。
其他文献
1982年,Z.Pawlak提出粗糙集理论,为处理不确定数据提供了一个很好的方法。近年来,粗糙集理论及其应用发展发展十分迅速,主要都着眼于粗糙集模型的概化、粗糙集中不确定理论的
蚁群算法是一种求解复杂问题的元启发式算法,它是意大利学者M. Dorigo, V.Maniezzo等人于20世纪90年代初,受到自然界中蚂蚁在觅食过程中所表现出来的路径寻找模式的启发率先
随着互联网技术和数字技术的发展,多媒体信息,比如图像、声音、视频,甚至是文本信息,已经成为人们获取信息的主要来源。人们可以通过互联网下载、传播网上的数字多媒体产品,
随着计算机网络技术的快速发展,网络犯罪日益增多,犯罪手段也日益多元化。这时计算机离线取证存在的许多不足就逐渐显露出来,比如:很多易失数据如内存映射文件等将会丢失,内核级
图像分割是图像分析,识别和图像理解的基础,是图像处理到图像分析的一个极其关键的步骤之一。正是由于图像分割的这种重要性,国内外一些学者对其进行了大量研究,同时也提出了
在大数据时代,如何利用好数据潜在信息价值,成为商业巨头能否实现经济飞速发展的重要因素。准确的目标预测,对于国民经济的发展具有不可估量的意义。在商业、经济和其他领域
随着国民经济的不断发展,环境保护和资源的有效利用也越来越受到人们的重视。煤炭循环经济是指煤炭在开采、运输和加工等过程中进行的减量化、再利用、资源化活动的总称。煤
变压式皮肤听声器的原理是把外界的声音信号转换为电压信号,通过刺激皮肤来达到“听”声的效果。目前变压式皮肤听声器已研制成功,在不需要手术和不产生任何副作用的情况下,能够
由虚拟现实延伸出来的增强现实(augmented reality, AR)技术已逐渐发展成为一门独立系统的学科。三维注册是实现AR的关键,它决定了虚拟目标如何准确地与真实场景进行结合。传
人脸识别是生物特征识别技术的一个重要分支,被广泛应用于公共安全、身份认证、机器视觉等领域。人脸图像是典型的非线性高维数据,容易受到姿态、光照、年龄等因素的影响而变化