基于多粒度特征并行处理的行为识别方法

来源 :西北大学 | 被引量 : 0次 | 上传用户:eight92
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于近年来人工智能的飞速发展,视频行为识别的应用场景越来越广泛,这一项技术也被国内外学者重点关注和研究。然而现有的视频行为识别研究使用的原始视频的RGB图像信息场景复杂且存在遮挡问题,并且随着视频场景的复杂程度越来越高,人体运动的交互也日渐增加,单一特征已经无法完整描述视频的全部运动信息。另外,研究者通常描述视频信息时往往只使用单一动作类,忽略了动作类组中存在的共享特征,但在许多不同运动类别中人的形态都存在相似性,极容易混淆,从而影响行为识别的准确率。为了解决上述问题,本文围绕多种特征并行处理融合和多粒度特征细化这两方面展开研究,提出了基于并行卷积循环神经网络的行为识别方法和基于并行多粒度特征细化网络的行为识别方法,从两种角度来进行行为识别,主要内容如下:1.针对视频的单一特征对视频运动信息表达不足的问题,提出了基于并行卷积循环神经网络的特征融合行为识别。本方法将RGB图像特征和人体关节点骨架特征分别输入到并行卷积循环神经网络的CNN部分和RNN+LSTM部分,在特征提取后将两种特征连接到一个联合时空特征向量进行特征融合,最终进行行为识别。实验结果表明,本文方法在UCF101数据集上的行为识别准确率优于其他主流行为识别方法,验证了本方法在行为识别上的有效性。2.针对视频单一特征运动信息表达不足,以及单一动作类无法完整描述运动信息,动作类组中共享特征被忽略的问题,提出了基于并行多粒度特征细化网络的行为识别方法。本方法放宽了对行为识别的需求限制,将一个视频的运动信息用多个动作类标签来描述。我们通过三个动作类标签组得到三个动作类粒度的特征,整合后得到RGB图像特征和关节点骨架信息的精确特征融合后进行行为识别。本文在UCF101数据集上进行实验,准确率高于传统主流行为识别方法,证明了该方法在行为识别上是有效的。同时对比了本文的两种行为识别方法在UCF101数据集上的准确率,由于基于并行多粒度特征细化网络的行为识别方法在特征提取和细化上更为细致,所以该方法的准确率高出基于并行卷积循环神经网络的特征融合行为识别1.1%。
其他文献
搜索引擎的使用方便了人们的生活,但其查询结果仍需要人工筛选。给定一个问题,如何精准地获取正确答案显得至关重要。答案选择排序是解决该问题的一个切入点,其关键就是问题
随着经济的发展,我国社会也在迅速转型,各方利益逐渐变化,多种社会矛盾随之显现,部分长期存在的较深层次问题以及矛盾也开始慢慢凸显,不利于社会大局稳定的各种问题还是存在,
加强青少年法治教育是实现全面依法治国、推进社会主义法治国家建设进程的基础性工程。根据国家法治教育总体规划,2016年6月我国司法部等三部委联合发布《青少年法治教育大纲
化石燃料的大量使用造成的大气污染日益严重。其中氮氧化物(NO_X)是主要的大气污染物之一。选择性催化还原(SCR)是NO_X排放控制的主流技术,催化剂是该技术的核心和关键。目前工业应用的钒钛类SCR催化剂存在诸多不足之处。所以开发新型催化材料成为该领域的研究热点。以稀土氧化物为主要活性组分的催化剂制备成本较高,工艺复杂,难以广泛性应用。本工作利用稀土精矿直接制备NH_3-SCR催化剂,避免了复杂的
当前我国正处于社会转型期。农村在新时期乡村振兴战略的推动下,迎来了史上最佳的战略发展契机,农民的获得感、参与感、幸福感日益提升。但是在农村社会利益格局不断发生调整
目的:本研究通过了解医学生个人信息及社交媒体职业精神行为现状,从而探讨医学生具有违背医师职业精神行为表现的原因,为规范医学生社交媒体行为提出建议,从而促进医学生健康
Ⅱ型裂缝作为一种滑动裂缝,实际包含了两种裂缝:一种是纯Ⅱ型裂缝,其边界未受任何正应力的影响;另外一种是压剪缝,其边界不仅受剪而且受压。压剪缝普遍存在于各种工程结构中,
人生既要看重八小时以内,也不可小看八小时以外。有人说,八小时之内是对党员干部责任心和事业心的考验,八小时之外是对党员干部品质和修养的考验。这话很有道理。八小时内外并不
随着我国举证时限制度的核心举证失权基本被费用性制裁措施所取代,民事诉讼中逾期举证已基本不会发生举证失权的后果。但逾期举证的当事人会受到法院的处罚,还可能要赔偿另一
近年来,国家对高等院校在资金、资源、政策等方面给予了很大的支持,高等教育发展迅速,教学规模也不断扩大,最明显的表现是大学生数量的倍增。在新的形势背景下,高校大学生的