基于卷积神经网络的静态图像密集人群计数算法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:qqiuhe123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于计算机视觉的人群计数技术,已逐渐被应用于公共安全等多个领域,并取得不错的成效,而不同领域的需求又给人群计数带来不同方面的挑战,人群计数已由早期的简单场景,过渡到能适应复杂场景计数。随着应用场景复杂化,对人群计数的要求越来越高。因此,设计、完善和改进人群计数算法,具有重要的研究意义与应用价值。深度学习的发展以及卷积神经网络在图像处理上的优异表现,已促进卷积神经网络应用到人群计数之中。在仔细学习研究典型的卷积神经网络人群计数算法后,形成集成CSRNet算法和MSCNN算法的设计思路,提出了一种基于卷积神经网络的人群计数算法,用于高度密聚集场景下的人群计数,具体研究工作包括4个方面。(1)通过对相关文献与理论知识的学习积累,获知基于卷积神经网络的人群计数算法基础。仔细阅读、学习和分析了关于卷积神经网络、传统人群计数和基于卷积神经网络人群计数等研究工作的相关文献和算法,总结了已有算法的优点与缺点,并在此基础上形成改进思路,提出了本文的算法。(2)构建基于卷积神经网络的人群计数模型。为有效提取人群特征,降低人群计数误差,应用MLP卷积层、MSB卷积层和空洞卷积,构建了基于多尺度空洞卷积神经网络人群计数算法模型。所设计的网络架构具有不同视野域,可以自适应的实现对图片不同尺寸特征提取,保证了网络模型的高性能。(3)图片ground truth标注算法设计。在本文ground truth标注中,选取人群中人体头部作为样本标注的对象,可减少背景与人群、人群间相互遮挡所造成的误差。使用二维高斯分布的方法进行ground truth标注,生成高质量密度图。(4)算法实验验证。使用ShanghaiTech数据集的PartA和PartB训练数据集,对本文网络模型训练,并使用ShanghaiTech数据集的PartA和PartB测试数据集对训练好的模型进行性能测试;使用Mall数据集进行对照实验,验证网络模型的泛化能力。实验从多个角度对网络模型进行验证,证明了算法的可行性和有效性。创新之处在于:(1)网络结构针对性强。为了更好适应密集人群计数,选用空洞卷积、MLP卷积层、MSB卷积层为基本单元,构建卷积神经网络模型,实验验证了有效性。(2)特征提取的自适应性。网络根据MSB卷积层中每列卷积层视野域的大小,自适应进行不同尺寸的特征提取。不足之处在于:(1)由于网络结构的制约,网络的学习能力有限,而且训练的时间过长,导致网络的实时性降低。(2)在进行特征提取时会丢弃一些关键的特征,而且人体头部的特征过少,环境中容易出现类似的特征,从而引起误差。后续研究中,可先对人群进行预判,然后再进行特征提取。
其他文献
幼儿园教学活动的游戏化主张是在幼儿园的"教"与"学"中融入游戏的形式、游戏的要素、游戏的精神,让幼儿在游戏中快乐、自主、自由地享受教育,这就为"幼儿教育以游戏为基本活
皮影戏又称弄影戏,起源于唐,繁荣于宋、元、明、清,至今已有一千多年的历史。华县皮影与全国其他各派系皮影相比较,无论雕刻、表演或唱腔都独具一格,堪称中国皮影的代表。
<正>问题陶总的公司刚创立没多久,为了生存,他的想法是在这个行业里的什么业务都要做,只要能赚钱;他的理想是,把这个行业里不同类型的业务尽可能都做好,从而实现业务上的多元
<正>俗话说:"三岁看大,七岁看老"。随着现代脑科学、心理学研究的发展,人们已经认识到:儿童时期是人一生中最重要的时期,身体素质、智力发展、个性品质都自此"打桩成形"。乍
文章通过构建中国1992—2007年(进口)非竞争型可比价格投入产出表,测算与分析了对外贸易对我国SO2排放的影响,并利用结构分解法研究了促进中国对外贸易隐含SO2排放增长的驱动
湖湘景观具有浓厚的文化意蕴。王船山运用湖湘景观的文化意蕴,以凄怆幽怨的词牌音韵,结合作者独特的人生际遇和历史背景,用情景交融的手法创作《潇湘怨词》,使得其内心沉郁的
随着经济社会的发展,我国长期以来形成的城乡二元经济结构模式,已经严重阻碍了城乡经济社会的协调发展。从党的十六大提出"统筹城乡经济社会""建设社会主义新农村、美丽乡村",到
加强企业预算管理体系的设计和研究,可以使企业的财务管理和内部控制工作更为科学合理,而在新的时代形势下,财务管理必须做好长期的创新改革。本文对当前设计研究企业预算管
分析了我国农村生活污水发生量、排放特点及治理现状;介绍了人工湿地类型、特点及污染物净化机理;结合我国农村现状,阐述了不同类型的人工湿地处理生活污水的适用条件及场所