基于运动学动态图的人体动作识别方法研究

来源 :天津工业大学 | 被引量 : 0次 | 上传用户:xinshuai99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别是计算机视觉领域中的一个研究热点,在智能监控、视频检索、人机交互、游戏等领域有着广泛的应用。深度相机的出现提供了视频的深度信息,解决了传统的基于RGB视频的人体动作识别方法受光照、背景等因素的影响较大的问题,同时也为如何处理这些信息带来了挑战。如何提取视频中的有效特征,一直是动作识别中的难点之一。近年来,研究人员在相关领域取得了巨大的进展,特别是基于动态图的人体动作识别方法取得了良好的效果。
  为了更好地利用视频的运动信息,本文提出了一种基于运动学动态图的人体动作识别方法。首先利用RGB视频序列和对应的深度图序列生成场景流特征图,场景流是空间场景中运动物体运动形成的三维运动场,包含了目标在真实场景中的运动信息。但场景流所包含的运动信息并不充分,为了解决这个问题,本文基于场景流特征图计算视频运动学特征图序列,所获得的运动学特征图序列中包含更丰富的运动信息;然后使用分层排序池化把运动学特征图序列编码为运动学动态图,同时使用分层排序池化把RGB视频序列编码为外观动态图;最后把运动学动态图和外观动态图输入到双流卷积网络完成人体动作识别。
  本文提出的人体动作识别方法在两个公开的RGB-D人体动作数据集上进行了验证,实验结果表明本文提出的方法能够有效地识别RGB-D视频中人的动作,尤其是对于双人交互动作识别更为有效。
其他文献
CFI ODP(臭氧破坏势)为零、GWP(全球变暖势)低,是近年来作为哈龙(Halon)替代物开发的一种新型灭火剂.由于其温度压力水平适宜,存在作为制冷空调系统中新一代工质的可能.该文着眼于制冷空调系统中的CFCs、HCFCs工质替代,在根据已有PVT实验数据关联适用于CFI的PT状态方程的基础上,考察了CFI的热力学性质、CFI及含CFI的混合工质在制冷工况与空调工况下的理论循环性能.提出了摩尔
学位
污染物NO对环境、气候和人类的健康影响日益严重,成为一个迫切需要解决的问题.火电厂燃煤产生的NO是排放的主要来源.然而人们对NO的生成机理尤其是燃料型NO生成机理及其复杂,至今还不完全清楚.本文对无烟煤、烟煤及水煤浆的燃料氮析出特性和燃料型NO的生成特性进行了深入的研究,为低NO燃烧系统的开发和设计提供理论基础和数据支持.本文对无烟煤,烟煤,水煤浆及黑液水煤浆的燃料氮析出规律进行了实验研究,主要研
学位
近几年来,世界对清洁和可持续能源的需求不断增加,随之而来的是对低成本小型风力发电系统需求的增加,因为小型风力发电机被视为一种经济和灵活的发电解决方案。小型风力发电机的优点是在负荷中心附近发电,因此不需要运行高压输电线路,这非常适合风资源丰富的偏远地区。永磁同步发电机(PMSG)具有转矩大、无需外加励磁电流、具有变速运行能力等优点,因此永磁同步发电机是小型风力发电机的理想选择。此外,外转子永磁同步发
建立合适且准确的三相变压器模型是进行配电网潮流计算的基础,节点导纳矩阵的推导是三相变压器建模的关键。目前,变压器节点导纳矩阵的推导方法以对称分量法和关联矩阵法为主流,对称分量法在进行程序运算时速度较快,但当变压器的三相参数不对称时便不再适用;关联矩阵法对变压器的三相参数是否对称情况没有要求,但当变压器原边绕组或副边绕组的接线方式为中性点不接地星形接线时,由于中性点电压不为零,此时变压器支路电气量与
目前面对新一代微波器件、电路和系统日益增长的模型需求的挑战基于神经网络的微波器件建模技术已被认为是微波计算机辅助设计领域的一种重要工具。人工神经网络模型可以通过训练来学习微波器件和电路的电磁行为。经过训练的神经网络模型由于仿真和优化时运算速度快可以用于更高层级的微波电路和系统设计。本论文的目的是开发一种先进的神经网络建模方法和模型外推技术以高效地生成精度高、稳定性强的微波器件模型。本文所提出的技术
学位
空间激光通信技术作为下一代通信技术,近年来受到了世界各国的广泛关注,并在该研究领域展开了激烈的竞争。目前在空间激光通信研究领域处于领先地位的是美国、欧洲和日本,他们对该领域的研究均已进入了卫星实验阶段,其他国家也在大力发展空间激光通信技术。  利用成熟的地面光纤通信技术来提高空间激光通信系统性能已成为主流选择之一,光放大器和波分复用技术可以有效地提高空间激光通信系统的探测灵敏度和通信数据率。因此,
神经网络在机器学习和认知科学领域是一种模仿生物神经网络的结构和功能的数学或计算模型,用于对函数进行估计或近似。至今已有若干种深度神经网络,如卷积神经网络(CNN)、循环神经网络(RNN),应用在计算机视觉、自然语言处理、语音识别与生物信息学等领域并获取了很好的效果,特别是卷积神经网络可以在目标识别、检测和场景理解等任务上达到前所未有的精度。从2012年提出的AlexNet(8层网络)到2015年提
基于AlGaN材料制备的深紫外发光二极管(DUV-LED)具有高能效、无污染等特点成为传统汞灯的理想替代者之一。本论文采用金属有机化合物化学气相沉积(MOCVD)技术在半极性r面蓝宝石衬底上外延生长了高质量非极性a面AlGaN材料,并成功制备出发光波长为280nm的非极性AlGaN基多量子阱(MQWs),为制备高光效的非极性AlGaN基DUV-LED奠定了坚实的基础。本论文的主要研究内容如下:  
近年来,随着可见光技术的兴起,对可见光的应用和开发随之而来。传统的室内定位技术研究包括ZigBee技术、WiFi、蓝牙、超宽带技术等都集中在射频信号,辐射强并且保密性差。本文在可见光通信(Visible Light Communication,VLC)发展的契机上,将可见光通信技术应用于室内,为室内定位技术提供了一种新的解决方案。  针对传统室内定位的不足,本文创新性的结合室内的具体环境特点与可见
随着现代通信和多媒体技术的迅猛发展,网络上数字图像的数量出现了急剧增长,如何从海量的数字图像中快速而有效地找到人们所需要的图像,是一个非常有理论价值和实际意义的研究课题。为缩小图像底层特征与高层语义之间的语义鸿沟,如何将图像底层特征与图像的语义视觉关键词相结合进行图像自动标注,以及如何利用学习的图像标签进行高效的图像检索,成为新的研究热点。本文研究属性的学习以及基于属性的图像检索方法,围绕着三个问
学位