论文部分内容阅读
视频中人体动作识别作为计算机视觉与模式识别领域中的一个重要分支,在智能视频监控、人机交互、运动分析、视频检索等诸多领域,具有广阔的应用前景,受到了国内外学者广泛关注。然而,视频中人体动作的复杂性和多样性,使其成为一项深具挑战的研究课题。本文根据人体动作视频拍摄时是否发生摄像机运动,将人体动作识别划分为固定摄像机拍摄视频(简称为静止视频)、运动摄像机拍摄视频(简称为运动视频)中人体动作识别两类。分别采用基于人体前景的全局表示、基于视频局部特征的局部表示方法用于静止、运动视频中人体动作识别。具体研究内容如下:1)基于时空条件信息的静止视频运动前景检测针对视频监控应用中,常发生的动态背景干扰问题,提出了基于时空条件信息的静止视频中前景检测方法。采用图像像素在时空域内的时空条件信息代替像素亮度进行运动前景、背景分类,并将视觉显著性原理引入时空域构建过程中,通过加权邻域内像素时空条件信息进一步抑制噪声,最后采用图像分块加速策略,实现了动态场景运动目标实时、高精度检测。2)基于黎曼流形的静止视频人体动作全局表示采用人体前景时空形状(Space Time Shapes,STS)进行人体动作全局表示,并针对STS匹配存在的高维问题,提出基于体内点辐射距离的STS三维形状局部采样(Local sample of Space Time Shapes,LsSTS)特征,统计LsSTS的协方差矩阵作为STS的特征描述对其降维。在黎曼流形框架下,以较低的计算复杂度,实现了较高的人体动作识别精度。3)摄像机运动不变视频局部特征提取及表示针对现有视频局部特征提取方法容易受到摄像机运动干扰的问题,提出了摄像机运动不变视频局部特征提取及表示方法。先在图像空域检测图像局部特征、并跟踪得到局部特征运动轨迹;再采用RANSAC(RANdom SAmple Consensus)算法检测前景运动轨迹,用于与人体动作相关的视频局部特征定位;最后利用背景运动轨迹进行摄像机运动补偿,提取摄像机运动不变视频局部特征描述子。该方法有效降低了运动视频中局部特征误检测率,提高了Bo F(Bag of Feature)模型进行运动视频人体动作识别的精度。4)视频局部特征时空编码算法针对Bo F模型在进行人体动作建模时忽视人体区域中视频局部特征时空位置关系的问题,将局部特征时空位置坐标引入局部特征编码中,直接对局部特征时空位置关系建模。实验结果表明,该算法优于向量量化、稀疏编码、局部约束线性编码等局部编码算法,可有效提高人体动作识别精度。5)基于视频分割序列集的人体动作分类为提高整段视频人体动作分类精度,提出了基于视频分割序列集的人体动作分类框架。通过将待分类人体动作视频划分为若干个部分重叠的视频分割序列,以视频分割序列集进行人体动作视频分类。可增加分类样本输入、保留更多人体动作信息,提高整段视频的识别率。在该分类框架下,分别采用了KNN投票分类、局部约束组稀疏表示分类(Locality constrained group sparse representation classification,LGSRC)等方法,有效提高了人体动作分类精度。