基于人体骨架的无监督动作识别

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户:moxihuanyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
鲁棒的动作识别,特别是人体动作识别,是在计算机视觉和人工智能系统中的一项基本功能。由于不受背景、灯光等变化的影响,对视角变化的鲁棒性更高等潜在优势,基于3D骨架的无监督动作识别已经成为计算机视觉中的重要研究课题,多年来研究人员提出了许多优秀的方法。这些方法中有的使用监督学习的方式,有些使用半监督学习和无监督学习的方式。当前基于骨架的监督学习和半监督学习的动作识别算法在实验数据集上已经取得了很好的性能,但是这些基于监督学习和半监督学习的算法非常依赖于监督,以及大量的训练实例和标签。而大规模数据集的标签的获得是十分昂贵和困难的,训练一个好的3D动作识别特征需要大量标记的骨架数据,这比获取大量标记的RGB视频要困难的多。此外,对于动作识别任务缺少大规模的有标注的数据集进行监督学习和半监督学习的训练任务,针对这一主要缺点,本文提出了两种基于骨架的无监督学习的动作识别方法。本文通过对骨架数据的特征表示以及动作识别算法进行了深入研究,提出了两种基于骨架的无监督学习的动作识别算法新模型。通过实验验证了其有效性,并且设计并实现了一套完整的基于监控摄像头的动作识别系统。本文的主要工作和创新点如下:1.Transformer是基于自注意力机制的,可以捕获长时序依赖关系。本文受到视觉Transformer模型的启发,在Transformer模型的基础上充分地结合了人体运动的特点,设计了一种基于上下文特征重构的无监督动作识别模型来全面地模拟每一帧内的人体骨架空间关系以及帧间的时间相关性。遮盖动作序列中的部分骨架帧,在自编码器中对数据样本编码成特征再解码重构,测试时使用KNN聚类,将动作类别归类为训练集中提取的最相似的特征所属的类别。通过这种无监督的训练方式,不需要提供标签进行训练,并且在具有挑战性的NTU RGB+D 60和NTU RGB+D 120公开数据集上的实验表明,本文的方法可以显著提高无监督学习动作识别的性能。2.对比学习属于无监督学习的另一种方式,之前的基于对比学习动作识别模型主要关注点在于通过增强对比学习的样本,从不同的输入骨架中学习动作序列的时序特征。而本文为了细粒度的捕获骨架序列特有的空间特征和时间特征,提出了基于对比学习的多尺度模型。它有两点优势,对骨架的空间位置应用多尺度,不仅可以捕捉单个关键点特征,更进一步可以捕捉到整个关节运动的特征。对骨架的时序序列应用多尺度,不仅可以捕获单帧与单帧之间的特征关系,更进一步地可以捕获多帧与多帧之间这种跨帧间的联系,使得学习到的特征对不同的运动速度具有鲁棒性。常规的骨架序列的输入,通常是将单帧的所有节点组合作为一个标记输入,可以更好地关注骨架与骨架之间的特征,即捕获动作序列的时序特征,而传统的这种输入方式往往忽视了骨架内部的空间信息,另一种方式是将动作序列中同一节点所有数据组合作为一个标记输入,这样可以更好的关注骨架内部的关键节点与关键节点之间空间上的关系。本文的创新点在于通过组合两种骨架序列的输入,增加了对比学习模型中具有相同语义内容样本的表示方式,间接增加了对比学习的难度,同时让模型不仅仅关注时序信息,而是能够更加全方位并且均衡的捕获骨架序列的时空特征。在具有挑战性的NTU RGB+D 60和NTU RGB+D 120公开数据集中,本文提出的无监督模型与在此之前的方法相比达到了最优的性能。3.集成上述算法,本文设计并实现了一套完整的基于监控摄像头的动作识别系统,该系统主要由视频显示模块、相机定位模块、动作识别算法执行模块组成。
其他文献
期刊
基于教育部《关于大力推进幼儿园与小学科学衔接的指导意见》,文章阐述了幼小衔接工作的主要内容,进一步分析了高质量开展幼小衔接工作的主要动因和当前影响我国幼小衔接工作的主要因素,逐一论述了高质量开展幼小衔接工作的具体实践路径,以期为相关教育机构和工作者提供一定参考。
目的 运用网络药理学和文献聚类分析揭示阳和汤治疗非小细胞肺癌(non-small cell lung cancer, NSCLC)的作用机制。方法 通过TCMSP数据库检索中药成分和作用靶点,GeneCards和NCBI基因数据库检索和筛选靶蛋白,随后将筛选出的阳和汤成分靶点和NSCLC靶点输入韦恩图制作软件得到交集靶点,作为阳和汤作用于NSCLC的预测靶点,进行后续的PPI网络构建、GO分析和K
目的 探讨甲硝唑联用克林霉素治疗细菌性阴道炎的临床效果。方法 选取74例细菌性阴道炎患者,根据用药方案不同分为研究组和对照组,各37例。对照组患者应用甲硝唑治疗,研究组患者给予甲硝唑联用克林霉素治疗。对比两组患者经治疗的临床疗效、随访期间复发率以及血清炎性因子水平和治疗期间的药物不良反应。结果 研究组总有效率高于对照组,差异有统计学意义(P<0.05)。研究组细菌性阴道炎的疾病复发率低于对照组,差
<正>在养鸡的总成本中饲料成本所占的份额最大,约占60%~70%,由于农户养鸡管理费用较低,饲料所占的比例更高达70%~80%。所以说饲料成本的降低就能带动整个养殖成本的降低。在这里与大家共同探讨一下降低饲料成本的方法。
期刊
中华文明自萌芽初期具“满天星斗”表征,渐趋多元一体特征。据古代多语种文献所记载之地理时空维度观古代“中国”与中华文明型塑历程,中原王朝统施政治经济文化外交系列措施,古代“中国”渐成各民族文化融合、幅员辽阔的文明古国。周代以降,文献所载地理时空概念的“中国”,有“中国”“中原”“四海”“九州”“十二州”“五服”“王畿”之称,随地域版图不断扩张,族群文化多样性特征较为显著。另外,从族群、族属、族类等以
为岑巩县辣椒产业发展提供决策参考,介绍岑巩县辣椒产业在发展规模和产业综合效益方面的发展现状,分析存在农户参与率低且管理粗放、配套设施不健全、投入成本高等问题,提出增加财政资金投入、加强技术人才队伍建设和农业技术培训、推广“企业+合作社+大户+农户”模式等发展对策。
本文介绍了一种基于计算机视觉算法的车道线检测法。该算法采用了python编程语言和open CV图像处理技术。在实际检测过程中,应用HLS阈值和sobel阈值对二值图像中的车道线进行聚焦,并采用滑动窗口搜索方法识别各自的车道线像素;应用二次多项式拟合方法识别左右车道线。在识别出车道后,计算出车道曲率和偏离车道中心的距离,最终计算并显示出车道曲率半径和车辆位置。实践结果表明,基于计算机视觉算法的车道