基于视频深度强化学习的群体人物行为识别

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:XDCHZHTXZHY
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
理解视频中群体人物的行为语义是人工智能领域的难点,主要任务要求运用深度学习、强化学习等算法整合序列化的人物动作线索来推理视频群体人物的行为语义。近年来模式识别技术的发展已能基本满足图像中个人动作的识别要求,但对视频中群体人物行为的研究还有待开拓。本学位论文以识别视频中群体人物的行为语义为研究目标,首先设计一种基于关键语义的特征提取方法抽取视频主要内容的多维融合特征,再设计一种基于目标候选区域的人物检测方法并行分类和定位视频中的群体人物,最后设计一种基于时空轨迹的语义抽取方法完成对群体人物行为的理解。本文的工作创新主要体现在以下三个方面:(1)利用视频帧层次聚类结果选取聚类中心,使用K-means算法优化层次聚类结果,抽取视频关键语义序列,利用双向特征处理通道融合多层级视频特征,完成视频多维融合特征的提取。在KTH数据集上进行关键帧提取实验,实验结果表明本文设计的基于视频内容的关键帧提取算法具有较高的关键帧查全率,能够有效聚焦视频关键语义。在COCO数据集上进行特征提取实验,实验结果表明本文设计的基于卷积神经网络的特征融合算法所提取的视频特征能够有效利用低层位置信息,具有更强的特征表达能力。(2)利用重复删除网络进行候选框去重,融合分类置信分数和分类概率结果选定目标候选框,引入多任务损失结构进行训练学习,并行处理目标边界框的类别分类和位置回归。在COCO数据集上进行目标检测实验,实验结果表明本文设计的基于多维融合特征的目标边界框提取算法获得较优的目标检测效果,能够更好地回归目标位置。在Volleyball数据集上进行人物定位实验,实验结果表明本文设计的基于人物特征的视频群体人物定位算法能够通过一阶段调参准确定位人物位置,减少计算成本。(3)利用掩码位置匹配特征进行帧间人物匹配,通过两层循环神经网络关联群体人物间的行为关系,构建行为时空关联模型抽取视频中群体人物的行为语义。在Volleyball数据集上进行语义抽取实验,实验结果表明,本文设计的基于运动特征的视频群体人物轨迹跟踪算法能够持续准确地追踪运动轨迹,更适用于群体人物场景,本文设计的基于循环神经网络的视频群体人物行为关联算法能够有效融合时空线索,具有较高的语义抽取准确率。
其他文献
高校为提高教学质量,提升其综合实力,竞相在人才市场高薪聘请名师、教授,客观上就造成了高校内部人才流失现象,给原组织带来了巨大的人、财、物的损失,对此,探讨高校教师隐形
[目的]探讨人文关怀护理在尿道下裂术后护理中的应用。[方法]将2015年1月—2016年12月收治的尿道下裂手术病人59例按住院号奇偶数随机分为观察组29例和对照组30例,对照组给予
为探讨禾谷孢囊线虫(Heterodera avenae,CCN)在山东省麦田的寒冬前孵出和侵染情况,于2014和2015年12月份在山东省部分地区分别对48和65个CCN病田进行了抽样调查。调查结果表明,
本试验旨在通过在德令哈枸杞上的肥效试验,筛选出对枸杞增产效果最佳的冲施肥种类,并掌握施用时期和方法。试验结果表明,根多叶绿+JINGPING+叶黄喷绿对枸杞增产效果最好。比
空肠弯曲菌是引起小儿腹泻的重要致病菌,现对我院2002年6月-2007年6月收治的76例空肠弯曲菌肠炎忠儿进行分析总结。
带隙数字式温度传感器是基于带隙结构,PN结增量电压正比于IC绝对温度(PTAT)的感温器件.它的测温精度较高,但存在着一定的误差.不过,其误差在时间和外部环境变化的条件下,保持
近年来,无灰分散剂的发展呈现多功能化的趋势,即通过一种多功能化的低剂量的无灰分散剂,在表现出优异的分散性的同时,还可有效解决随之引起的油品粘度增长等问题。本文主要调
<正>中国混凝土与水泥制品协会指定会刊《混凝土世界》(China Concrete)是我国混凝土材料与工程行业的综合性期刊,是中国混凝土与水泥制品协会指定会刊,涵盖预拌混凝土与水泥
目的探讨低温等离子系统在扁桃体腺样体切除术中的应用效果及对此病患者的护理策略。方法回顾性分析2014年5月至2015年8月我院收治应用低温等离子系统进行扁桃体腺样体切除术
随着人们生活质量的提升,人们对于房屋建筑的要求也逐渐提升。房屋建筑工程的施工过程中,外墙保温工程始终是一项重要的施工环节。外墙保温工作得当,能够在一定程度上满足人