轻重网络相结合的未分割视频时序动作定位方法研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:asd2303690
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频动作定位是动作识别的前提,不准确的动作定位结果会进一步影响动作识别的精度,所以研究高效准确的视频时序动作定位方法很有必要。在实际中,视频往往是未分割的,也就是说事先并没有给出预分割出的提议段,如何在内容复杂多变的未分割视频中快速定位出各个不同种类和不同长度的动作片段具有很重要的研究和实际意义。现有的视频动作定位通常由候选提议段抽取、提议段特征提取和动作边界回归组成。由滑动窗生成候选提议段策略存在的问题是产生的候选提议段数目庞大,不仅给后续的特征提取和回归任务带来很大负载,且产生的大量提议段和真正的动作片段关联性较差。另外,边界回归网络是一种单元级定位方法,粒度较大,对大尺度视频片段的定位结果不是很理想。因此,为了解决上述问题,本文提出了一种轻重网络相结合的时序动作定位方法,首先通过轻量级网络进行动作提议段的粗检测,然后通过重量级网络对提议段检测结果进行帧级别的细粒度动作定位,最后对稠密的预测信息进行NMS合并后处理。具体的做法为:在提议段检测模块,把滑动窗产生的不同尺度下的视频片段作为输入,送入到基于ResNet-10的提议段识别网络进行二分类(0为提议段,1为非提议段,即背景),骨干网络采用ResNet-10的好处是该轻量级网络可以快速地对视频片段进行提议段识别。针对检测到的提议段的动作位置不准确问题,本文设计了基于ResNet-50的时序动作回归网络进行帧级别的动作置信度判识和位置偏移量预测。这样做的好处一方面是采用重量级不仅可以提取视频片段的更具区分性的深度特征,另一方面可以产生稠密的类别和位置预测信息,方便对小尺度和大尺度的提议段都进行更好的定位。为了验证本文提出的轻重网络相结合的未分割视频时序动作定位方法的mAP和AR-AN性能,在THUMOS-14数据集上进行了实验测试,实验结果表明,本文方法比2017年 Gao J 等人在 IEEE 会议中提出的 TURN(Temporal Unit Regression Network)方法mAP@0.5高出8.49%,比2018年Lin T等人在ECCV会议中提出的BSN(Boundary Sensitive Network)方法mAP@0.5高出1.11%;基于ResNet-10的时序动作提议段检测方法和TURN方法产生候选提议段个数分别约为6.6万和40.8万(约6倍的差距),但本文方法在AR-AN@100高出TURN方法7.12%;综上实验结果表明,相对于现有的方法,本文的方法快速且高精度完成了未分割视频时序动作检测任务。为了实际应用,本文将研究结果应用于空巢老人远程救助中,针对空巢老人无人照看在发生跌倒等危险动作时无法得到及时救治的社会问题,开发了一款基于时序动作定位的空巢老人远程救助系统,实现对处于监控条件下的空巢老人实时进行跌倒检测和自动预警,使老人可以得到外界的及时救助。
其他文献
目的探讨海昆肾喜胶囊对早期期糖尿病肾脏疾病患者尿蛋白的影响。方法选择2010年1月~2012年1月在我院肾内科确诊的临床期糖尿病肾脏疾病(Mogensen分期Ⅲ期)患者162例,随机分
会议
多类别文本分类是自然语言处理任务中的一项基础任务,文本分类算法效果的提升,也会使自然语言处理领域诸多其他任务的处理效果得到提升。目前在学术界诞生了种类众多、性质各
随着信息技术和多媒体采集工具的高速发展,使图像、视频、音频等逐渐成为信息传播的主要载体并发挥着至关重要的作用。然而,功能强大的图像编辑工具和易于操作的图像处理软件
随机解调系统(Random Demodulation,RD)是将压缩感知理论运用到模拟信息转换中的一种重要方法,其具有结构简单,硬件可实现性强的特点,在一定程度上可以实现对稀疏模拟信号的
路牌识别技术是现代智能驾驶中一项关键技术,它可以辅助驾驶者准确获取道路信息。在驾驶者对道路情况不熟悉的条件下,避免分散更多精力去辨别路牌信息,有助于行车安全。特别
视频监控系统近年来发展迅速,数据量海量增加。这些海量的数据不仅给人力检索和浏览带来挑战,在数据传输和存储方面也带来巨大的压力。因此,智能视频监控技术成为了研究的热
随着无线移动通信的飞速发展,移动通信网络日趋复杂。一方面,通信设备种类混杂,网络制式多样、网络层次复杂、网络规模庞大等诸多因素使得无线通信网络规划的难度显著提高。
含硫类化合物有着极为普遍和重要的应用价值,S-S键、C-S键在化合物中极为常见,此类结构一般具有很高的药用价值。随着技术的飞速发展,该结构类化合物慢慢应用到了能源开发领
概念漂移是数据流挖掘的一个研究热点与难点,也是现实世界和网络世界中普遍存在的一种现象。随着互联网技术的快速发展,愈发受到学术界与民众的关注。目前概念漂移尚未有统一
形态特征是生物体与生活环境长期相互作用的结果,探讨生物体形态在不同环境下的差异及相互关系已成为现代生物学研究热点之一。耳石是鱼类重要的听觉器官和平衡器官,其形态与