论文部分内容阅读
基于计算机视觉的人群计数技术,已逐渐被应用于公共安全等多个领域,并取得不错的成效,而不同领域的需求又给人群计数带来不同方面的挑战,人群计数已由早期的简单场景,过渡到能适应复杂场景计数。随着应用场景复杂化,对人群计数的要求越来越高。因此,设计、完善和改进人群计数算法,具有重要的研究意义与应用价值。深度学习的发展以及卷积神经网络在图像处理上的优异表现,已促进卷积神经网络应用到人群计数之中。在仔细学习研究典型的卷积神经网络人群计数算法后,形成集成CSRNet算法和MSCNN算法的设计思路,提出了一种基于卷积神经网络的人群计数算法,用于高度密聚集场景下的人群计数,具体研究工作包括4个方面。(1)通过对相关文献与理论知识的学习积累,获知基于卷积神经网络的人群计数算法基础。仔细阅读、学习和分析了关于卷积神经网络、传统人群计数和基于卷积神经网络人群计数等研究工作的相关文献和算法,总结了已有算法的优点与缺点,并在此基础上形成改进思路,提出了本文的算法。(2)构建基于卷积神经网络的人群计数模型。为有效提取人群特征,降低人群计数误差,应用MLP卷积层、MSB卷积层和空洞卷积,构建了基于多尺度空洞卷积神经网络人群计数算法模型。所设计的网络架构具有不同视野域,可以自适应的实现对图片不同尺寸特征提取,保证了网络模型的高性能。(3)图片ground truth标注算法设计。在本文ground truth标注中,选取人群中人体头部作为样本标注的对象,可减少背景与人群、人群间相互遮挡所造成的误差。使用二维高斯分布的方法进行ground truth标注,生成高质量密度图。(4)算法实验验证。使用ShanghaiTech数据集的PartA和PartB训练数据集,对本文网络模型训练,并使用ShanghaiTech数据集的PartA和PartB测试数据集对训练好的模型进行性能测试;使用Mall数据集进行对照实验,验证网络模型的泛化能力。实验从多个角度对网络模型进行验证,证明了算法的可行性和有效性。创新之处在于:(1)网络结构针对性强。为了更好适应密集人群计数,选用空洞卷积、MLP卷积层、MSB卷积层为基本单元,构建卷积神经网络模型,实验验证了有效性。(2)特征提取的自适应性。网络根据MSB卷积层中每列卷积层视野域的大小,自适应进行不同尺寸的特征提取。不足之处在于:(1)由于网络结构的制约,网络的学习能力有限,而且训练的时间过长,导致网络的实时性降低。(2)在进行特征提取时会丢弃一些关键的特征,而且人体头部的特征过少,环境中容易出现类似的特征,从而引起误差。后续研究中,可先对人群进行预判,然后再进行特征提取。