论文部分内容阅读
异常行为的检测与分析能够自动地检测出场景中发生的异常行为并及时报警,有效减少了公共场合内群众的人身伤害以及财产损失,是智能视频监控领域的关键技术。目前,异常行为检测分为全局异常行为检测以及局部异常行为检测。全局异常通常表现为群体异常,只需要帧级别的检测,主要面临背景干扰以及光照变化等难点。局部异常需要像素级别的检测,主要面临行为动作多样性等难点。本文针对不同的场景分别提出了不同的检测框架,主要的贡献如下:1、针对全局异常行为检测,本文提出了一种基于特征融合的检测框架。在全局异常行为检测中,单一的特征表达并不能很好地应对视频中的背景干扰等问题。基于此,本文设计了一种基于稀疏自编码的特征融合框架,对运动特征(多尺度光流直方图)以及表观特征(显著信息)进行有效融合,不仅起到降维去除冗余的作用,同时也生成更丰富的组合特征以及高层特征。除此之外,为了更好地对局部特征进行组织形成全局特征,本文使用费舍尔向量代替传统的词袋模型,配合线性支持向量机进行全局异常检测。最后,本文在UMN数据集以及Web数据集进行实验效果验证,分别取得了99.65%以及87.6%的AUC值,验证了本文框架的有效性。2、针对局部异常行为检测,本文提出了一种基于卷积神经网络的检测框架。在局部异常行为检测中,传统的局部特征主要依靠人工设计,费时费力且具有一定的应用局限性。基于此,本文设计一种基于卷积神经网络的检测框架。通过7层的深度网络,从而提取语义信息更加丰富的高层特征。该网络结合了2D卷积与3D卷积,能够对视频的时空信息进行有效挖掘。除此之外,为了解决网络训练过程中所出现的“梯度弥散”问题,本文引入了基于无监督缓慢变化分析的预训练,加速训练收敛。为了提高检测的效率,本文还设计了基于显著信息与光流信息的异常候选区域检测。最后,在USCD数据集上取得了82.1%的检测率。