论文部分内容阅读
群体行为识别算法作为目前计算机视觉领域的一个热点研究课题,为公共安全领域的视频监控等提供了有效的技术手段。随着计算机视觉技术的快速发展,基于图像的目标检测、识别等技术逐渐趋向于成熟,但是基于视频的目标检测、识别算法的精度还需进一步提高。群体行为识别作为行为识别的一种,由于场景的多样性、人群密度的不同、群体间的相互遮挡等,相比于单个人的行为识别更复杂。虽然近几年对该课题的研究取得了一些阶段性的成果,出现了一些可供研究的大型数据库,但是现有的群体行为识别算法大都比较复杂,算法的识别精度不高,鲁棒性不强。距离度量在图像理解和模式识别领域的许多应用任务中扮演着十分重要的角色。欧氏度量使用最为广泛,它将输入样本空间看成是各向同性的,对数据样本维度分量之间的潜在关系不能公平地反映。马氏度量和凯莱-克莱因度量考虑了数据样本维度分量之间的相关性,即非平等地对待数据样本的各个维度分量,在实际应用中比欧氏度量有更好的识别性能,论文采用马氏度量和凯莱-克莱因度量学习实现视频中群体行为识别,以提高识别算法的准确率和鲁棒性,主要研究内容和研究成果如下:(1)研究了一种基于M-DTCWT和椭圆马氏度量的群体行为识别算法。针对目前视频帧中的群体行为识别算法存在的算法复杂度高、识别准确率不够等问题,该算法选择在频域上进行特征提取,并利用距离度量进行分类。为了进一步增加频域分解的方向选择性,在DTCWT滤波器组的基础上增加沙漏型分解滤波器组和重构滤波器组,构造M-DTCWT滤波器组,对视频中的人体图像进行多尺度多方向分解,获得分解后的高低频系数,提取高低频系数特征。为了更好地度量未知样本之间的相似性,反映数据样本维度分量之间的潜在关系,采用椭圆马氏度量对群体行为特征进行分类,完成视频中的群体行为识别。实验结果表明,相较于支持向量机等经典分类算法,所提算法具有更高的识别准确率。(2)研究了一种基于NSDTCWPT和Cayley-Klein度量学习的群体行为识别算法。NSDTCWPT具有平移不变和细节保持等特性,利用NSDTCWPT对视频中的人体图像进行多分辨率分解,获得分解后的高低频系数。针对单一的纹理特征在群体行为描述上的不足,在ILBP特征的基础上,增加了一种特征描述,即IDSC特征,它不仅可以表示全局信息还可以描述局部信息,并且对目标存在肢体变化和非刚性变化具有更好的鲁棒性。另外,考虑到IDSC易受轮廓采样点数目的影响,又引入了词袋模型,有效的降低了采样点数目和位置变化对群体行为识别的影响。Cayley-Klein度量学习能够对样本之间的潜在关系进行建模,对群体行为具有更好的区分性。算法采用Cayley-Klein度量学习对得到的融合特征进行学习,完成视频中的群体行为识别。在Behave视频集、Group Activity视频集和自建视频集上的实验结果表明,相较于支持向量算法和马氏度量算法,所提算法具有更高的识别正确率。(3)研究了一种基于群体结构特征和Cayley-klein度量学习的群体行为识别算法。上述给出的算法前期都需要对每个人进行准确的跟踪,由于场景的复杂性和遮挡的存在可能造成跟踪丢失,针对这个问题,给出了利用人体关节点的位置变化来提取群体结构特征,即提取组中心、运动直方图、亲密性直方图和中心性直方图,再采用Cayley-Klein度量学习对得到的群体结构特征进行学习,实现视频中的群体行为识别。该算法能更好地对人与人之间的关系进行刻画,对复杂场景下的群体行为识别更加鲁棒和有效。