基于Faster RCNN的视频动作检测

来源 :北京工业大学 | 被引量 : 8次 | 上传用户:yunkang0820
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究视频动作检测,旨在提出一个高检测准确率的动作检测方法。受近年卷积神经网络(Convolutional Neural Networks,CNNs)在图像识别和视频识别领域取得实质性进展的启发,本文动作检测方法也基于卷积神经网络构建和实现。本文动作检测方法的工作流程分三个阶段:第一阶段在帧层面运用Faster R-CNN网络获取多个兴趣区域,同时使用该网络分别提取兴趣区域的表观和动作特征;第二阶段在帧层面使用支持向量机(Support Vector Machine,SVM)对兴趣区域进行分类;第三阶段在时序上将分类得分值高的兴趣区域连接并形成竞选管道,再将综合得分最高的竞选管道作为视频最终的动作检测结果。为验证本动作检测方法的有效性,以及检测准确率更高,我们在JHMDB和UCF Sports两个数据集上分别做了实验,与当前最好的运用卷积神经网络构建的动作检测方法进行对比。在覆盖阈值为0.5时,本动作检测方法在两个数据集上的动作检测准确率分别达到60.86%和80.12%,分别提高了7.5和4.3个百分点,检测准确率有了显著提升。本文也给出覆盖阈值为0.6时在这两个数据集上的检测准确率,分别为56.12%和80.12%,仍然比当前最好的方法在取覆盖阈值为0.5时的检测准确率要高,另外本文方法在UCF Sports上的检测准确率仍取得了80.12%,这说明本文方法在要求定位更准确的条件下仍能取得较高的检测准确率。检测准确率更高意味着动作分类误差更小,同时动作定位更精确、检测效果更好。实验结果表明本动作检测方法有效性好,在视频动作检测任务中检测准确率更高,本文提出的动作检测方法具有一定的研究和应用价值。
其他文献
为了能够实时了解国际双边合作中有价值的信息,高效地智能提取Web外交新闻中的国际合作元素就显得至关重要。将国际合作元素抽取抽象为类似命名实体识别的问题,首先,界定国际合作元素的内涵;其次,提取了蕴涵领域知识的规则;再次,结合神经网络与领域知识提出了面向外交新闻文本的国际合作元素抽取方法;最后在相同语料库中与神经网络方法以及自身规则组合进行了比较,实验结果表明该方法具有更好的效果。
维尔纽斯工程建筑学院筑路机教研室研制了一种弹性离心联轴器(发明证书号142715),用以联接机器轴和高速动力装置机构的轴。
本文以水性环氧树脂为改性剂对乳化沥青进行改性,利用极化曲线法,结合电化学交流阻抗技术研究了涂覆在A3钢上沥青-环氧树脂复合涂层在不同的涂层厚度、不同的腐蚀时间、不同
从医学文本中识别时间短语是临床医学自然语言处理的关键技术之一。传统基于规则和机器学习的方法需要设计复杂规则和提取特征,而且大多数系统采用串行方法会导致错误的传播。提出了一种基于双向长短时记忆网络(BLSTM)的神经网络架构,在识别时间表示式的同时判别它们的类型:首先使用卷积神经网络(CNN)学习得到单词的字符级别向量和大规模生物医学背景语料上训练得到的词向量进行组合作为BLSTM的输入,然后使用B
Complex [Sr2(pdc)2(H2O)7]·H2O(1, H2 pdc=2,3-pyrazinedicarboxylic acid) has been synthesized and characterized by single-crystal X-ray diffraction studies a
针对现有基于监督学习模型的评价对象提取方法中,多评价对象和复合词评价对象提取精度不高的问题,提出基于句法结构和依存关系的评价对象提取方法。首先,根据评价对象、情感词在句法结构中充当的不同成分,分析评价对象和情感词之间的依存关系;然后,根据不同的依存关系定义特征;最后,在条件随机场模型中,通过贪婪式特征选择方法选取最优的特征组合,进而完成评价对象提取。在COAE2011 task3的评测数据中进行实
<正>新近报道,我国糖尿病患者已达1.1亿,约有5亿人处于糖尿病前期。我国已经成为世界上肥胖人口大国,而超重的成年人也已经超过了30%[1]。2013年来自上海交通大学医学院的报
Two new 1,3-oxazin derivatives, C22H24N2O5(3I) and C19H16N2O5(3II), have been synthesized via an unusual cascade reaction. The attractive aspect of this cascade