论文部分内容阅读
智能监控技术可以对公共场所实施全景监控,帮助管理者制定有效的疏散和控制方案,提高社会安全性。在智能监控研究领域中,人群行为分析由于存在运动环境复杂、目标遮挡等因素,成为当前研究的热点和难点。论文围绕人群运动的语义分析和行为识别展开深入研究,主要工作和贡献如下:(1)针对监控场景中光照变化所导致的运动检测误差问题,提出了一种对传统变分光流模型的改进方法。采用假定颜色不变量守恒与人群运动梯度守恒结合的数据项,解决了人群运动在复杂光照条件下的运动检测问题;通过引入自适应各向异性的平滑项,解决了已有光流计算模型平滑项对运动边界过度平滑的问题,较好地保留了细节特征。实验表明:该方法在光照变化和局部曝光的图像序列中,较同类方法能更能将地提取出准确运动信息。(2)提出了基于LDA主题模型的人群行为特征降维方法,解决了基于计算机视觉的人群行为分析技术中视觉特征的维数灾难问题。即首先在光流场基础上提取视觉特征;然后利用视觉词包模型解决低级视觉特征与高级语义特征间的转换问题;最后基于LDA模型提取人群行为的语义表示,解决了视觉特征的降维问题。(3)提出了采用粒子光流构建视觉词包模型的方法,用于解决现有视觉词包缺少时序和空间特征结构的上下文信息,有效实现词包特征对人群行为主题在高级语义层次地抽象。通过粒子在光流场间的传播关系,定义了人群运动信息在时间和空间尺度上特征变化的信息结构。实验表明,该方法由于考虑了视觉单词在行为主题表达上的时序和空间结构关系,能够明显提高人群行为的识别精度。(4)提出了类型指导的相关主题模型CG-CTM,有效改善了因隐式行为主题数量引起语义表示的重叠性、二义性问题,并实现了对人群运动模式相关性的建模。通过这种弱监督学习方法提取的人群行为语义特征,实现了相同人群行为的有效聚类,加大了不同人群行为之间的区分度。本文方法通过一对一的SVM分类器,在PETS基准数据库上进行了人群行为的识别实验。结果表明:基于类型指导的相关主题模型CG-CTM,结合采用粒子光流的视觉词包模型,有效地提高了人群行为的识别精度。