基于卷积神经网络的图像人群计数研究

来源 :中国科学技术大学 | 被引量 : 3次 | 上传用户:jinhuikkkl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在我国经济飞速发展的过程中,视频监控为维护公共安全与社会稳定发挥了重要的作用。近年来,智能化监控系统受到广泛关注并发展迅速,其能够高效地对视频图像数据进行分析汇总并辅助决策。人群计数是智能化监控系统的重要内容,旨在利用计算机视觉技术准确估计图像中的人数,在安防预警、城市规划、智能商业、交通调度等领域有着重要应用。随着深度学习技术的发展,基于卷积神经网络的人群计数算法取得了优异的性能,显著地降低了计数误差。然而,在实际的应用场景中,现有的算法仍面临着诸多挑战,如人群尺度变化、透视效应、背景干扰、非均匀的人群分布等。为解决上述问题并进一步提升计数准确率,本文从网络结构、损失函数、训练方法、数据预处理等多方面入手进行研究,针对不同挑战构建高效可行的解决方案。本文的主要研究工作与贡献总结如下:1.针对人群尺度变化问题,提出了跨层连接卷积计数网络与多尺度的训练方法以识别不同尺寸的人群目标。由于卷积神经网络并不具有尺度不变性,因而难以准确识别尺寸变化的目标。本文通过串联多个跨层连接的多尺度卷积单元构建计数框架,增加网络中不同尺寸感受野的数目,进而建模多种尺寸的行人目标。多尺度训练方法能够使所提出的模型适应同一目标的多种尺度输入,从而有效地提高了计数准确率。2.为解决人群图像中复杂背景对计数算法的干扰问题,提出了抗背景细节卷积网络与加权欧几里得损失,用于抑制背景噪声的影响。经实验研究发现,人群图像中的背景信息主要存在于以图像低频分量为主的基础层,而移除图像基础层后所剩余的细节层则包含人群前景。因此本文将图像细节层作为卷积网络的输入,提取人群特征并用于回归人群密度图。同时图像细节层能够有效地压缩映射范围,提升网络的训练效率。加权欧几里得损失以不同的权重计算背景与人群区域的欧式距离,从而惩罚将背景识别为人群的错误估计。实验结果表明上述机制能够有效地应对背景干扰,降低计数误差。3.针对非均匀的人群分布问题,设计了二阶卷积注意力网络以应对图像中不同区域的人群密度变化。人群图像往往存在局部人群聚集而其他区域人群稀疏的现象,增大了算法的估计难度。本文在卷积网络主干后引入多个二阶卷积模块以增强模型的特征提取能力,建模多种人群密度分布。基于空洞卷积的上下文注意力模块对每个二阶卷积模块的输出特征进行自适应调整,使其关注不同密度的人群区域,提升网络对复杂人群分布的鲁棒性。4.为产生高质量的人群密度图,提出了一种基于多层特征融合的编码解码网络结构。人群密度图作为大多数计数算法的回归目标,其质量直接影响了计数的准确性。所提出的模型在编码网络与解码网络之间建立连接,融合卷积网络的低层局部细节与高层语义信息,强化人群特征表示。同时生成高分辨率的人群密度图,利用更多像素描述局部人群细节。此外,在网络中设计了融合特征自适应调整机制,多个密集连接的空洞卷积层被用于提取多尺度上下文特征,引导通道注意力机制完善特征融合流程。逐像素的背景与人群分类任务用于辅助密度图估计。多个数据集上的实验显示上述算法有助于提升密度图的质量,提高计数准确率。
其他文献
针对一般控制系统,利用微分几何中的曲线理论提出了形状变量、被控形状轨迹曲线和形状合同控制等概念.然后,针对一类具有双输入及二维形状变量的非线性系统,利用相对曲率概念和曲
随着一首自然清新、深情美妙的歌曲《和谐乡村》,我们就走进了清爽、芬芳、绿色、希望的乡村世界,在那里"蓝天白云灿烂星光"伸手可触,"绿野芳菲鸟语花香"好不惬意,"父老乡亲
"一带一路"倡议为跨境电商的高速发展提供了历史契机。本文通过对我国跨境电商的现状和中东地区市场特点进行了分析,指出了其入驻中东地区的机遇:政府政策扶持,强大的电商市
2008年最值得聆听的声音,乐坛黑马王若琳第一张个人唱片《StartFromHere》在推出后仅仅数月就迅速蹿红,成为众口称誉的新一代小天后。7月14日SONYBMG特别为王若琳在上海召开
通过对催化剂活性组分的筛选,钯/碳(Pd/C)催化剂对脂肪腈与二甲胺反应制备单烷基二甲基叔胺有良好的选择性。采用浸渍-沉淀法制备出负载型Pd/C催化剂,考察了制备过程中溶液体系的pH
贵阳发电厂9号机6号轴承振动长期徘徊在90μm左右,对机组的安全运行构成威胁,本文对振动的原因进行了研究和分析,提出在目前的状况下降低振动的措施,保障机组的安全运行。
"智者乐山,仁者乐水"山水之间,钟灵毓秀。从夏商的徐州,周的青州,春秋的鲁地,西汉至北宋先后的虹县、夏丘县等一直到现在的安徽省蚌埠,这个"淮水绕东南,沱浍注西北,惟漴合于