论文部分内容阅读
在大数据时代,随着世界人口的快速增长与技术的进步,基于监控视频的人群统计方法有着广泛的应用,包括公共场所安全监控,商场情报收集和分析,公共空间设计等。现有的基于检测、回归以及卷积神经网络算法展示出了优秀的性能,但与此同时,基于检测和回归的算法通用性差,以及卷积神经网络算法架构复杂的问题依然存在。在此背景下,本文将重点针对以上问题,对中等密度动态场景和高密度场景人群统计展开研究,具体研究内容如下:(1)针对中等密度动态场景,提出了一种基于特征点的人群统计方法,该方法结合检测与回归方法的优势。本文首先分析了中等密度动态场景中存在人群密度变化以及一定程度遮挡的特点,为此确定了计算复杂度低,通用性强的检测方法。在此基础上,根据检测器输出不够精准的问题,使用了迪里赫雷特混合模型的高效聚类。然后使用了基于特征点数量的人群统计方法,从而大大提高了人群统计的准确度。(2)在特征点人群计算方法的基础上,提出了特征点数量和人群密度相关性的算法,并为此设计了数据融合方法。本文分析了中等密度动态场景中,人群密度快速变化的情况下,人群检测存在漏检和重复检的问题。针对问题设计了特征点数量和人群密度的关系,并在中高密度区间的相邻三帧做数据融合,使得鲁棒性提高。实验结果表明,算法在中低、中高密度区间都超越了数据库最佳的成绩。(3)针对高密度人群场景,本文提出了一种人群统计的卷积神经网络模型。通过卷积神经网络学习一种非线性函数,得到相应的人群密度图,从而避免了复杂的回归器设计。在全卷积神经网络模型中,嵌入了反卷积结构并且联合使用视角信息,使得输出图和输入拥有相同的尺寸大小,保留了更多空间信息。实验证明,该方法在高密度人群场景中,平均统计准确率达到了最佳。本课题针对人群统计方法中存在的问题,提出了两套复杂度不同的解决方法,实现了全密度场景覆盖。实验证明,本课题设计的算法,具有良好的性能以及较高的实用价值。