基于改进3D卷积神经网络的群组行为识别算法研究

来源 :青岛科技大学 | 被引量 : 0次 | 上传用户：a13315157220

【摘要】

：

近年来,随着智能监控系统的广泛应用以及计算机视觉技术的不断发展,群组行为识别已经成为智能视频监控领域中的关键技术,对于公共安全、人机交互和视频分析等领域具有重要的

【作者】

：

张甜甜

【出处】

：

青岛科技大学

【发表日期】

：

2020年01期

【关键词】

：

群组行为识别 EC3D卷积神经网络交互关系建模多分类器权重自适应决策融合算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,随着智能监控系统的广泛应用以及计算机视觉技术的不断发展,群组行为识别已经成为智能视频监控领域中的关键技术,对于公共安全、人机交互和视频分析等领域具有重要的研究意义。社会的快速发展,对有效防范大规模群组事件的发生提出了迫切要求,如何构建一个高效稳定的群组行为识别算法是解决该问题的关键。而在构建群组行为识别算法过程中依然存在几个核心问题需要亟待解决。其一,提高网络运行速度是保障智能视频监控系统实时性的核心问题;其二,交互关系建模是影响群组行为识别精度的核心问题;其三,综合利用多线索特征是全面提高群组行为识别性能的核心问题。本文针对上述三个问题进行重点研究,并做出以下几点贡献:(1)网络运行速度慢是制约智能监控系统实时性的核心问题,本文提出一种高效的C3D网络(Efficient 3D Convolutional,EC3D)模型,提高了时空特征提取阶段的网络运行速度。针对C3D网络参数多、训练速度慢的问题,本文从降低参数量的角度入手,将C3D网络中7*7*3的时空卷积分解为7*7*1的空间卷积和1*1*3的时间卷积,每个卷积核的参数量由原来的7*7*3=147个,变为7*7*1+1*1*3=52个,参数量减少了64.6%。通过实验对比EC3D与C3D的网络运行速度发现,在相同时间内EC3D能够处理的数据量约为C3D的5倍,证明了本文针对C3D的改进是有效的。从而保证了EC3D在进行时空特征提取时能够处理更多的数据。(2)交互关系建模是影响群组行为识别精度的核心问题,本文提出了一种基于EC3D与交互关系建模的群组行为识别方法,通过构建群组无向图挖掘群组内部人与人之间的相互影响。首先,利用EC3D提取每组视频帧的单人时空特征;然后,根据单人时空特征和位置信息构建群组成员之间的交互关系无向图模型;其中,无向图顶点为群组成员,顶点之间的连线表示双方交互关系,连线粗细表示彼此关系的强弱;再后,利用图卷积网络(Graph Convolution Network,GCN)对该交互关系无向图进行动态维护,并获得交互关系特征实现群组行为分类。通过实验证明,基于交互关系特征的识别结果能够有效弥补未考虑交互关系方法中的不足,从而使群组行为识别精度得到提升。(3)多线索特征综合利用是提高群组行为识别精度的核心问题。本文将整体网络架构设计为分层模式,分别基于不同特征进行群组行为识别。第一层网络基于上述交互关系特征进行群组行为预识别,另一层网络基于EC3D网络提取全局场景时空特征,构建另一条群组行为预识别通道。针对上述两层网络的Softmax分类器在识别过程中呈现的性能优劣动态变化,本文采用多分类器权重自适应决策融合算法,将两个分类结果进行加权融合,做出最终决策。其基本思想是:基于K-最近邻算法准则,通过计算测试样本与训练样本之间的聚类相似程度,确定测试样本的有效邻域,并根据不同分类器在有效邻域中的分类准确率,给不同分类器分配权重,然后对不同分类器的输出结果进行加权融合,实现复杂场景下的群组行为识别。为了验证本文算法的有效性,在CAD(Collective Activity Dataset)和CAE(Collective Activity Extended Dataset)两个公开群组行为识别数据集上做了大量实验,平均识别精度分别达到了91.4%和97.9%,与当前流行识别方法相比表现出了较好性能。因此,证明了本文所提出的基于EC3D与交互关系建模方法在群组行为识别过程中的有效性和可行性。

其他文献

人口结构、长寿风险分担和养老金领取年龄

长寿风险分担是社会养老保险的基本功能之一。社会养老保险中的短寿参保者和长寿参保者通过保险基金转移实现对长寿风险的分担,而人为设定的养老金领取年龄决定了短寿参保者

学位

社会养老保险长寿风险分担代际长寿风险分担模型人口结构养老金领取年龄

基于深度学习的短时交通流量预测研究

如今,城市中心的交通拥堵状况相当严重,这使得人们的出行变得愈发困难。因此,短时交通流量预测受到了越来越多学者的关注和研究。然而,传统的短时交通流量预测研究大多是对单

学位

智能交通系统短时交通流量预测主成分分析卷积-门控循环单元双向门控循环单元时空特征周期性特征

复杂场景下二维码的高速稳定识别

二维条码作为一种高信息集成、强抗干扰能力的编码方式,在移动终端以及工业流水线上普遍运用。其中QR码因为其独特的定位特征以及快速响应特性常见于各类移动终端,Data Matri

学位

二维码复杂场景局部自适应连通域标记

大分子改性剂对硅粉/SBR复合材料松弛行为影响

丁苯橡胶作为世界上最先实现工业化生产的橡胶,其加工性能优良、制品的使用性能好、运用范围广,在汽车、电器、水利等领域广泛使用。本文通过分子量不同的改性剂对硅粉进行改

学位

大分子改性剂MAPTMS硅粉界面性能界面结构丁苯橡胶

基于巴氏距离的生成式对抗网络收敛性问题

随着计算能力的提升,以及神经网络的发展,越来越多的学者投身于生成式模型的研究。生成式对抗网络,通常可以简称为GAN,是一种在当前十分流行的生成式模型。自最原始版本的生

学位

生成式对抗网络巴氏距离生成器判别器

城市发展与种族冲突：1967年底特律骚乱研究

17世纪开始,底特律从一个殖民定居点逐步发展起来。19世纪,依托大湖区便利的交通条件和丰富的矿产资源,底特律从一个小城市逐步发展成为美国重要的工业城市,并在20世界初,依

学位

底特律骚乱城市化种族

豉香型传统工艺饼曲及机械化麸曲中化合物差异研究

豉香型白酒的传统工艺饼曲是一种具有代表性的小曲种类,曲的品质能够影响酒的质量和出酒率,曲中的不挥发性化合物能够决定微生物的生长,同时也是重要的风味前体物质,但小曲中

学位

豉香型传统工艺饼曲机械化麸曲衍生化挥发性及不挥发性物质差异分析

余能回收液力透平导叶的型式选择与性能分析

液力透平是一种利用液体的动能及压能做功的多级涡轮式流体原动机,特别适用于工业流体(液体)高压能的回收利用,利用液体的高余压产生旋转动力,带动发电机发电,或带动水泵、风

学位

余能回收二级液力透平导叶优化水力设计

化学发光计算断层成像的重建方法研究

发动机内部燃烧流动过程极其复杂,机理仍未明晰,现有的燃烧诊断技术无法实现对湍流燃烧过程的瞬时三维测量。火焰的化学发光能够实时反映燃烧状态与火焰的结构信息,计算断层

学位

火焰化学发光计算断层成像投影模型重建算法

承力框架铸件浇注系统优化与组织性能研究

本文针对现有承力框架熔模精密铸造成形存在的缩松铸造缺陷严重问题,采用Procast计算机数值模拟软件并基于现有产品缺陷情况,预测熔模精密铸造成形承力框架缩松缺陷的产生,通

学位

数值模拟浇注系统铸造缺陷组织力学性能

基于改进3D卷积神经网络的群组行为识别算法研究

其他学术论文