时序行为检测算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:huanhuan879600
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行为识别任务需要裁剪好的视频片段作为输入,但实际采集的是未裁剪的原始视频,该任务与实际的情况出入较大。在这种情况下,时序行为检测任务被提出,旨在原始视频中定位出行为动作的时间边界,并对该动作进行分类。虽然该任务最近才被提出,但由于其实际意义重大,很快成为了视频理解研究领域的热门。本文主要从端到端和非端到端的网络框架对时序行为检测任务进行研究,主要内容如下:1.特征网络与任务网络的研究与选型。由于与识别任务的关联性,通过对行为识别算法进行研究,本文确定了以自动特征和三维卷积网络为特征网络研究重心。由于与目标检测任务的相似性,通过对目标检测算法进行研究,本文确定了两阶段的任务网络框架,并重点研究如何将二维算法时空泛化。2.研究并改进了一种非端到端时序行为检测算法。该算法以3D ResNeXt为特征网络,对行为提名生成和行为分类进行独立训练与优化。行为提名生成网络,将定位时间边界问题转换成视频特征每个位置是否是动作,开始时间,结束时间的二分类问题。根据网络输出,将开始和结束时间节点按照一定规则组合,并通过NMS得到最终行为提名。另外,在提名网络中引入非局部模块和带孔卷积,深度挖掘视频特征信息,并进行了对比实验。行为分类网络,根据提名网络生成的行为片段信息,复用原始视频提取的特征,将每个行为提名正确归类为对应的动作类别。最后,对滑动窗口长度进行了探究和实验。3.研究并改进了一种端到端时序行为检测算法。该算法以C3D和3D ResNeXt作为特征提取网络,对行为提名生成和行为分类进行联合训练与优化。行为提名生成网络,首先,将提取的特征图上每个点映射回原视频,在原视频的时间维度上设置一系列先验框;然后,通过提名网络完成先验框二分类与时间边界回归,并通过NMS获得最终行为提名。另外,通过修改先验框,进一步挖掘视频的深度特征信息。行为分类网络,前述任意长度的提名片段送入3D ROI Pooling网络层,将其变成等长的特征,然后通过识别网络对特征进行具体的行为分类和精确的时间边界调整。最后,改进网络结构并使用3D ResNeXt提取特征,将其与基础网络进行了对比实验,并对先验框的设置进行了探究和实验。
其他文献
目的探讨超声技术在产前诊断中孕胎儿疾病的临床价值。方法应用实时彩色多普勒超声仪进行多个切面对孕20~28周的胎儿进行常规超声检查。结果在5473例中孕妇女中,检出胎儿畸形1
我院自1997年7月起收治肝脓肿15例,均在CT导引下穿刺抽脓,除1例明确诊断手术引流外,其余14例均获抽脓治愈,现介绍如下。资料和方法一、一般资料本组15例,男9例,女6例。年龄17~79岁,平均51岁。11例发生于右肝,4例
目的观察负压封闭引流(VSD)治疗慢性骨髓炎的临床疗效。方法 12例慢性骨髓炎患者先采取病灶清除处理,再给予负压封闭引流治疗,Ⅰ期封闭创面,Ⅱ期植骨,伴有软组织缺损较多者植皮
目的比较瑞芬太尼和芬太尼复合丙泊酚全凭静脉麻醉在支撑喉镜下声带息肉摘除术中的临床应用效果与价值。方法选择ASAⅠ-Ⅱ级择期行支撑喉镜下声带息肉摘除术患者60例,随机分
目的研究Bmi-1和CD133在食管癌组织和癌旁正常组织中的表达及其与临床病理特征的关系。方法收集手术切除食管癌的石蜡标本90份,采用免疫组织化学法对手术标本石蜡切片进行染
芬太尼透皮贴剂(商品名:多瑞吉)是一种新型麻醉类镇痛药,其主要特点为通过皮肤吸收药物进而发挥疗效.肝动脉灌注介入化疗栓塞术是局部治疗肝癌、肝转移病灶的一种非手术首选
在人们的日常生活中身体常常出现各中各样的问题,疝气就是人们日常生活中比较常 见的病症,而腹外疝在疝气中非常常见的一种类型,那么如何在生活中进行腹外疝的预防 以及怎样
目的分析早产儿颅内出血(ICH)的高危因素,为早期采取相应的防治策略提供依据。方法收集新生儿重症监护病房患儿58例,根据患儿临床表现结合床旁B超检查结果(有无颅内出血)分为ICH
我县地处吕梁山区,近年来在河川地推广一种收益较高的种植方法——玉米套种大蒜。采用这种方法,一般每亩收1,000斤玉米(114元),350辫大蒜(350元)、300斤蒜苔(75元),总产值达5
期刊
各种原因引起的大咯血常危及患者生命,内科治疗病死率高,且易复发,近年来介入栓塞治疗大咯血的报道不少[1-3],所用栓塞材料多种多样.我院自1991年以来,采用明胶海绵颗粒和聚