基于特征融合和注意力机制的人群计数方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:JINZI1975
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,视频监控系统被广泛部署到实际生活中。而人群计数任务作为适用于该系统的智能化程序之一,在保障社会公共安全,人流管控等方面占据着重要的作用。如何提高视频监控中人群计数的精确度,已经成为相关研究人员共同面对的技术难题。监控视频捕获的图像由于多样的场景布局、不同的图像分辨率、透视变化和复杂的背景噪声等因素,导致人群对象被严重遮挡和呈现大规模的尺度变化,制约了对人群数量估计的准确性。由此在高密度冗杂的人群场景中,实现准确的计数非常困难。本文针对高密度复杂场景下的行人头部尺度变化和复杂背景噪声干扰等问题,展开基于特征融合和注意力机制的人群计数方法研究。具体研究工作和取得的研究成果如下:1)针对行人头部尺度变化问题,设计了一种渐进式多阶段特征融合模型:规模感知多阶段融合网络。基于特征结合策略,通过捕捉和拼接不同感受野的行人头部特征,设计了多尺度空洞卷积模块,能够感知不同尺度的人群特征,同时学习到更多的行人细节信息。此外,设计了一种新颖的特征结合策略U型融合结构,能够从网络的深层至浅层,逐步地融合相邻阶段输出的多尺度特征,使浅层信息和深层信息之间进行互补增强,从而进一步提升网络对人群信息的感知能力和对多尺度特征的提取能力,实现了较低的计数误差。2)针对复杂背景噪声干扰的问题,同时考虑到人群头部尺度变化,设计了一种简单但有效的级联模型:尺度感知和全局上下文网络,该网络主要由特征提取网络以及尺度感知和全局上下文模块组成。其中尺度感知和全局上下文模块是受注意力机制的启发,在前述多尺度空洞卷积模块和U型融合结构的基础上,设计的一种复杂度更低的注意力模型。该模块中融合了多尺度特征的选择和全局语义信息的提取,并且通过多尺度全局上下文语义信息去矫正捕获到的多尺度特征,使生成的特征图能够更加专注于人群区域,减少对背景噪声特征的关注,从而进一步提高计数模型的性能。3)针对以上提出的模型进行了大量的实验,分析和验证了在高密度繁杂的人群场景下,提出的方法对于抗人群尺度变化和背景噪声干扰的有效性和强大性能。
其他文献
图像作为最直接和便捷的信息载体,备受人们的青睐,这驱使了计算机视觉相关工作需要以更具创新和更大格局的发展态势。图像翻译技术作为计算机视觉领域的关键技术之一,得益于它的高价值和高可用性,备受越来越多的研究者关注。图像翻译技术旨在通过学习原始图像到目标图像的映射关系使得图像内容中某个属性的转换。一对一映射关系的图像翻译技术是目前的主流方法,但是在面对多组图像数据时,需要依据图像转换样式的数量来训练多个
学位
随着科学与技术的迅猛发展,现代工业设备的结构日益复杂,自动化水平也不断提升,机械设备的安全性和可靠性变得尤为重要。滚动轴承是旋转机械设备中至关重要的零部件,也是非常容易磨损的部件,其在运行过程中发生的任何故障或失效不仅会引起严重后果,还可能造成重大经济损失。随着物联网技术发展,通过振动测量传感器采集振动信号的故障诊断方法已成为了一种有效手段。然而,设备的工况(如:负载、转速等)往往会根据实际生产需
学位
伴随着互联网Web2.0以及信息技术的飞速发展,社交网络媒体蓬勃兴起,人们成为内容的生产者并从信息匮乏的时代进入到信息过载的时代。为了解决信息过载所产生的问题,推荐系统诞生了。推荐系统帮助人们从大量的数据中筛选出可用的电影、音乐、文章、商品等,找到最有价值的信息推荐给用户。看电影是人们娱乐的一种重要方式,得益于5G网络的快速发展,人们可以随时随地在线上观看高质量的电影,而不需要去线下的影院。电影推
学位
随着工业的高速发展,现如今空气污染问题日益严峻,对人类健康生活和社会发展带来的影响不容小觑。环保问题历来备受重视,有关空气污染的研究也越来越多。针对此问题,发掘地区空气质量变化模式、探索污染物的演变规律有助于有关部门针对具体情况制定治理和预防政策,对于大气污染的防治有重要意义。然而空气质量数据多源异构,具有信息量大、数据维度高的特点。传统分析方法难以直观有效地揭示空气质量存在的变化规律,存在分析过
学位
推荐系统为用户从冗杂的数据中提取信息,在缓解信息过载方面起着重大作用。数据稀疏和冷启动问题是影响推荐性能的两大问题。随着社交网络的普及,基于用户社交关系的推荐应运而生,社会化推荐方法可以有效缓解数据稀疏和冷启动问题,受到研究者和业界的广泛关注。目前的社会化推荐模型仅利用社交关系缓解数据稀疏问题以提升推荐性能的作用有限。为此,本文针对两种主流社会化推荐模型,分别提出双图混合随机游走的模型和基于自监督
学位
随着工业化和信息化的深度融合,传统制造业正面临着深刻变革,车间调度问题作为一个典型的NP-难问题则更加备受关注。基于群智能的元启发式方法在求解车间调度问题上取得了不错的效果,但该类算法的参数大都需要预先设置,无法根据所求解问题的特征进行自适应调整,从而影响求解质量。近年来,将强化学习与传统的元启发式算法相结合来解决复杂组合优化问题成为了一个热门研究方向。群智能搜索算法能够对复杂问题的解空间进行快速
学位
在数字经济时代,数据是至关重要的生产要素,通过跨地域和跨行业的数据流通融合释放价值。然而,各类隐私保护法规的提出使得这些数据大多以“数据孤岛”的形式存在于各企业和机构中,不再适用于传统的集中式数据存储和分析。为此,谷歌率先提出一种名为联邦学习的新方法,它适用于两个或两个以上数据方之间合作构建机器学习模型,将模型带到数据端,使得各方数据能在不离开本地的情况下完成模型的优化。尽管如此,联邦学习中也存在
学位
风能产能丰富、分布广泛,是可再生能源之一。对风电场的风速进行预测分析能够优化风电场的风力调度,提升风能利用效率。但受到空间信息、天气信号等因素影响,风速预测工作存在诸多挑战。现有的解决方案大多针对单风场风机预测,也无法在历史数据缺失的情况下进行风速预测。本文开展基于时空神经网络的风电场超短期风速预测研究及设计,鉴于不同风场在空间方面存在一定的规律性,同一风电场在时间、空间方面也具有一定的强相关。现
学位
森林是一种重要的生存资源,森林火灾是破坏森林资源的最大的不可控因素。森林大火一旦发生,会严重的破坏森林资源、毁灭动植物以及危害人民群众的生命财产安全。诸多不可控的因素如雷击等给森林火灾预防工作带来了不小的挑战,因此对森林火灾初期的检测,预防小火变为大火就显得尤为重要。深度学习的发展和图像处理技术的进步为预防森林火灾提供了新的手段。本文采用卷积神经网络进行模型训练,实现对初期森林火灾的检测与识别,并
学位
医学设备的发展使得医学影像技术得到了很大的提升,使用医学影像图片对病例进行诊断变得越来越重要。如果能够通过医学图像得到精确的诊断,就能让病人减少手术等侵入式诊断造成的伤害。但是随着相关病例越来越多,医生可能每天都要依靠经验去诊断,巨大的工作量会导致误诊率上升。因此,在近年来的医学图像研究中,不少研究人员采用深度学习技术进行辅助诊断,该方法展现了更高的效率,也取得了很多研究成果。然而在非小细胞肺癌分
学位