论文部分内容阅读
由于人体行为识别在应用上具有广阔前景,比如智能监控、智能交通等,使其成为计算机视觉领域前沿的研究课题之一。研究初期,针对传统的RGB数据,有许多经典的算法被提出以及应用。但是传统的RGB数据本身容易受到外界环境的干扰,因此人体行为识别技术一直处于缓慢发展状态。随着科学技术创新发展,Microsoft公司发布了深度图传感设备Kinect,为人体行为识别技术的发展提供了新的动力。深度数据不仅包含空间信息而且对光照变化抗干扰能力强,因此基于深度数据的行为识别算法研究受到热捧。本论文基于深度图和线性表示模型对人体行为识别进行一系列研究,具体工作内容为:(1)提出了基于判别协作表征分类器的人体行为识别方法。该方法首先对深度图像序列提取出深度运动投影图(Depth Motion Maps,DMMs)特征,该特征不仅受环境干扰小而且可以描述出运动对象的外形特征。其次,本文基于稀疏表示分类器提出了判别协作表征分类器(Discriminative Collaborative Representation Classifier,DCRC),该分类器通过对表征系数的二次约束提高了分类器的性能和鲁棒性。最后,利用DCRC对提取的DMMs特征进行分类,从而实现人体行为识别。(2)由于深度运动投影图特征丢失了动作的时间信息,对具有时间信息的相似动作识别效果不好,因此提出了深度运动投影金字塔(DMMs Pyramid,DMMP)特征描述子。该特征包含多个尺度的深度运动投影图特征,使得对动作描述信息更丰富,接着使用DCRC对提取到的DMMP特征进行分类和识别。(3)提出了一种基于meta-Action字典学习的行为识别方法。由于稀疏表示分类器中直接使用训练样本作为过完备字典,包含冗余信息过多,因此基于元基因和字典学习的思想,本文提出了meta-Action字典学习分类器。同时,本文又提出了加权深度运动投影金字塔(Weight DMMs Pyramid,WDMMP)特征,相比于深度运动投影金字塔特征,加权深度运动投影金字塔特征包含更精确的信息。最后利用meta-Action字典学习分类器对提取的特征进行分类。