基于深度学习的自由体操视频自动描述方法研究

来源 :华侨大学 | 被引量 : 0次 | 上传用户:gqkhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现代人日益注重健康、推崇体育运动的大背景下,体育视频的数据量和受众群体迅速增长,以及其潜在的应用价值而引起科学研究者和工业界的广泛关注。本文研究的内容是自由体操视频自动描述。所谓自由体操视频自动描述,是指通过观察视频中运动员的成套动作,来生成该运动员所执行的这套动作的专业名词。本文的研究在体育运动分析,自动解说,运动指导等方面有着广泛的应用价值。本文中对自由体操视频内容自动描述的研究,更具体而言是对自由体操视频中人体动作的自动理解。本文将结合计算机视觉和深度学习相关知识,实现对视频序列中存在的特定的人体运动的智能化标记和表示。本文的主要工作如下:(1)基于长短时记忆网络来实现对自由体操视频的自动描述。在经典的视频描述模型S2VT中,利用长短时记忆网络,来学习单词序列和视频帧序列之间的映射关系。本文引入注意力机制,突出决定自由体操动作的关键帧的重要性。本文建立了专业赛事的自由体操分解动作数据集。在MSVD数据及自建数据集上进行实验,运用计划采样的方法,消除训练解码器和预测解码器之间的差异。实验结果表明了本文改进的方法能提高自由体操视频自动描述的精度。同时,在本文的实验中,也对不同的卷积网络提取特征的效果进行对比,分析了特征提取网络对自由体操动作自动描述的影响。(2)基于三维卷积网络和多标签分类的自由体操视频的自动描述方法。一套自由体操动作由多个分解动作组成。在本文的工作中,构建单个分解动作的分类器,将自由体操动作的自动描述问题转化为多标签分类问题。由前面章节的内容可知,随着特征提取网络深度的增加,实验效果增强,然而二维卷积神经网络在提取特征时会丢失时间信息,所以本文中采用三维卷积网络对视频进行时空上的特征提取。对提取到的特征进行多次二分类来实现多标签分类的目标。为了形成对比实验,将分类的结果随机组合成为一个句子,与第三章自动描述方法的结果进行对比,验证该方法的有效性。
其他文献
目的探究伴有躯体症状抑郁症患者实施认知行为治疗的临床效果。方法回顾性分析我院收治的62例伴有躯体症状抑郁症患者,按照数字随机法,分为治疗组31例和对照组31例,对照组实施艾
延迟满足(delay of gratification)是一种心理成熟的表现,具体指为了更有价值的长远结果而主动放弃即时满足的抉择取向,在等待期中展示的自我控制能力。作为特殊群体,孤独症
针对综采工作面过断层区域顶板破碎,煤壁松软,易发生煤壁片帮、冒顶事故的实际问题,综合研究通过注浆加固断层区域工作面前方煤岩体,达到改善力学性能和加强承压能力的目的。
[目的]系统性红斑狼疮(systemic lupus erythematosus,SLE)病程中任意阶段出现外周及中枢神经系统病变则称为神经精神狼疮(Neuropsychiatric systemic lupus erythematosus,N
用砂培方法研究了不同铝浓度的营养液处理后,小麦根系分泌氨基酸和糖的种类及数量。结果表明,铝胁迫条件下。小麦根细胞膜受到损害,透性增加,并引起植物体内碳氮代谢紊乱。这证实
土钉墙支护是一种较好的原位土加固技术,因其具有占地面积小、施工速度快、造价低、施工工艺简单等特点,在基坑工程支护中普遍应用。根据《建筑基坑支护技术规程》JGJ120-201
随着近年来全球“汉语热”的进一步升温和国际汉语推广的逐渐开展,对外汉语教师的师资队伍日益壮大。新手教师作为其中特殊的一部分,要尽快适应对外汉语教师这一角色,成为一
渗漏水是游泳池工程中常见的工程弊病。本文针对这一问题,从施工方案、抗冻抗裂机理和具体施工实施三个方面提出了解决措施,可供类似工程借鉴参考。
本研究根据布迪厄文化资本理论,旨在探讨上海进城务工人员随迁子女家庭文化资本现状,及随迁子女家庭文化资本之“内在形式文化资本”“客观形式文化资本”“制度化形式文化资
电迁移已成为引起电子元器件失效的一个重要可靠性问题,这是因为微型化使焊点尺寸持续减小而封装密度和功率密度持续增加,通过焊点的电流密度持续增大易导致焊点发生液/固电