论文部分内容阅读
如今,人工智能领域理论的崛起、计算机视觉技术以及数字图像处理技术的发展,大大促进了人数统计和人群密度估计的发展,人数统计已不知不觉地遍布于生活中的各个角落,如学校教室、商场出入口、街道监控点、候车广场的中心处等。基于人头或头肩的目标检测方法虽然可以识别、定位目标并实现计数,但不适用于拥挤程度高、人群数量大的室外场景。针对室外场景,人群密度估计旨在生成高质量的人群密度估计图并估计人群总数,具有较高的研究意义和应用价值,如人群监控、人流量管理等。基于人群密度估计,本论文立足于广场、街道、车站等室外人流量较大的场景,解决生成人群密度估计图质量不高、人群数量统计结果不准确的问题,开展室外人数统计方法的研究与设计工作,同时设计并开发了一套针对室外人数统计的系统。本论文提出了一个基于编码器-解码器模型的人数统计方法SED-CNN,该方法的网络结构借鉴了编码器-解码器理论和模型的思路,并且是一个端到端的网络结构。其中,编码器模型采用了多列多尺度感知块,它能有效地提取图像中的特征信息。解码器模型采用了单路径反卷积网络作为主要网络结构,各层反卷积网络采用不同尺寸的卷积核。同时,为优化网络模型的训练,本论文使用了由三个部分组成的损失函数,分别为均方误差损失函数、结构相似性损失函数和人数统计损失函数。此外,我们在三个公开的人群数据集上进行了大量的实验,实验结果证明了此方法的有效性。本论文设计了一个针对人群密度估计的条件约束型对抗网络模型CDEcGAN。受到利用条件约束型对抗网络架构解决图像转图像问题的启发,CDEcGAN模型以人群图像的密度估计真值图作为额外条件信息来优化模型训练。其中,生成器模型以SED-CNN为基础进行改进,判别器模型的设计以PatchGAN分块判别算法为基础,关注生成图像的高频部分,以期提高生成图像的质量。经过实验证明,此模型具有可用性和有效性。最后,本论文基于两种不同架构的人群密度估计模型设计并开发了针对室外场景下的人群密度估计系统。