复杂场景下基于卷积神经网络的图像人群计数模型研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:mkms2080
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代科学技术的不断发展与进步,视频监控以较低的成本在交通要道、车站、机场、公园、学校等重要公共场所得到广泛应用。准确地估计视频或图像中的目标对象数量是一项具有重要意义且充满挑战的任务。在各种目标计数任务中,人群计数具有广泛的实际应用,在安防预警、城市规划、智能商业、交通调度等众多领域均起着重要的作用。人群计数的主要任务是精确估计人群图像中的人数与人群密度的空间分布,然而由于人群场景存在遮挡、光线变化、杂乱无章的背景和视觉的外观变化所带来的挑战使得该问题变得更加困难。鉴于此,本文从人群特征表示入手,针对人群场景计数需求,构建网络模型并设计特征提取策略,从而提出了复杂场景下基于卷积神经网络的图像人群计数模型研究。具体研究内容如下:首先,针对复杂人群场景密度高且分布不均问题,提出基于交叉对抗和注意力上下文信息的人群计数模型。采用两分支生成对抗网络设计,在生成网络的U型结构上嵌入空洞卷积来扩展空间维度特征提取并关注边界信息,结合注意力机制聚焦全局空间以及更多纹理特征细节;综合以交叉对抗损失函数为主的多重损失判别优化回归训练;将交叉对抗联合训练生成的残差信息与上下文信息共同融入到特征学习与密度图估计中,以应对复杂背景与人群分布不均对计数准确性产生的影响。其次,针对复杂人群场景尺度变化问题,提出融合尺度感知和双重注意力感知信息的人群计数模型。采用共享网络设计来自适应编码多尺度的上下文信息,并连接卷积透视变换来附加尺度间的过渡信息;通过双注意力机制同时从位置与通道的维度来编码内部语义信息并强化特征信息表达;级联尺度感知与注意力感知特征学习并进行密度图估计,以解决复杂人群场景中尺度变化明显对准确人群计数所产生的干扰。然后,针对一些人群计数模型在跨场景应用时受到训练时间和数据标记的影响,寻求借助少量的有标签图像或无标签图像来快速调整已有模型问题,提出仿射参数引导下的场景自适应人群计数模型。借鉴小样本非监督图像转换设计模型,由监督网络通过少量未标记图像生成计数网络中批量归一化的仿射参数使其可以自适应不同目标场景;同时在人群特征提取中通过自适应调整卷积参数来获取更多特征细节,并借助通道注意力融合浅层特征与深层特征;将特定人群场景需求与自适应监督参数网络结合在一起实现特征学习与密度图估计,以解决网络模型对标记数据的需求以及跨场景应用问题。最后,针对非限制性条件下特定人群场景中计数问题,提出基于区域识别的跨模态协同表示学习人群计数模型。通过双重信息传播机制动态增强模态共享和模态特定表示以充分利用光学信息与热成像信息之间的互补性;同时利用对可见光图像的区域识别设计以及热红外图像自身具有的区域性特点来达到关注人群感知背景的目的;结合点注释密度贡献概率模型,与融合背景感知的多模态表示学习一起完成特征提取与密度图估计,以解决不同光线条件下非限定人群场景的计数精确度问题。
其他文献
进入21世纪以来,企业财务舞弊行为不断升级,国外有能源巨头安然公司的轰然倒塌、迪斯尼公司虚增营业收入60亿美元,国内有康美药业300亿资金无端蒸发、瑞幸咖啡深陷财务迷局。这些财务舞弊案件的发生,严重影响了资本市场的健康有序运行,沉重打击了投资者对资本市场的信心,从一定程度上破坏了经济的稳定性。为此,西方国家完善了立法和执法环节,加强了对资本市场的监管力度。与西方国家相比,我国正处于经济转型期,国家
学位
GH4169高温合金的热加工和冷加工性能优良,常作为航空航天等领域的高温部件用材,由于工作环境对于材料的组织性能具有较高要求,因此有必要采用特殊的处理及生产手段对此类材料进行改良。多向锻造技术作为一种典型的剧烈塑性变形工艺,通过对锻件施加不同载荷方向的压缩变形来实现晶粒组织的显著细化,从而获得显著提高的综合力学性能。本文在闭式多向锻造(Closed multidirectional forging
学位
随着能源和环境危机日趋严重,开发绿色能源和节能技术成为当前迫在眉睫的问题。LaFeO3作为ABO3型钙钛矿氧化物由于具有来源广、价格低廉、耐高温、环境友好等优点被视作具有巨大潜力的镍氢电池新型负极材料。但由于LaFeO3具有易团聚、电导率低、动力学性能差等问题限制了其进一步的应用。为解决这些问题,本文通过掺杂以及包覆处理的方法对LaFeO3进行改性,系统的研究了LaFeO3的微观结构和电化学性能,
学位
取代1-氨基异喹啉和联芳基轴手性化合物广泛存在于许多天然产物和生物活性分子中,例如,Papaverine、Sanguinarine、Mastigophorene和Steganacin等都具有良好的生物活性。此外,1,1′-联-2-萘酚(BINOL)、2-氨基-2′-羟基-1,1′-联萘基(NOBIN)和1,1′-联-2-萘胺(BINAM)为代表的联芳基轴手性化合物已被广泛应用于不对称催化领域。因此
学位
研究背景结核病是由结核分枝杆菌(Mycobacterium tuberculosis,M.tuberculosis)感染引起的一种慢性传染病。在宿主抵御M tuberculosis感染中,T细胞介导的免疫应答发挥主要作用。卡介苗(Bacillus Calmette-Guérin,BCG)是唯一获得临床许可的结核病疫苗。新生儿接种BCG可预防对儿童罹患严重的结核病,但对成人缺乏有效的保护。其中的原因
学位
自润滑关节轴承以其承载能力强、耐腐蚀、自润滑等优异特性,在航空航天等领域发挥着重要作用,开展对自润滑材料性能的研究是提高自润滑关节轴承质量和延长其使用寿命的关键。聚四氟乙烯(PTFE)自润滑性能优异,然而较差的力学性能和耐磨性制约了其在摩擦学领域的应用。对PTFE的填充改性是改善和克服PTFE的缺陷,以及增强聚合物摩擦学性能的有效方法。然而,一些填料(例如:二氧化硅、氧化铝和少层石墨烯)的掺杂虽能
学位
手性是自然界广泛存在的现象之一,探究分子手性的构造与表达对于理解自然界中的各种复杂的生命过程具有重大的意义。圆偏振发光(CPL)作为手性发光材料的特征之一,主要是指手性发光物质在光或电的激发下,发出的左右圆偏振光强度不同的现象。近年来,研究人员对具有圆偏振发光性质的手性光学材料表现出极大的关注,这是由于圆偏振光在光学信息加密存储、生物编码和不对称光聚合等方面有巨大的应用价值。而构筑能对外界刺激作出
学位
燃料电池作为电力能源的一种,特点是可以直接将燃料的化学能转换为电能。在燃料电池工作过程需要一定量的催化剂来降低反应对体系环境的要求并提高反应速率。因此,催化剂的研究探索在燃料电池的发展应用中具有非常重要的意义。目前在燃料电池催化剂领域中,Pt被公认为是效果最好的。但是传统的Pt催化剂存在催化效率偏低、循环寿命短、稳定性不理想等诸多问题,加之由于地球上的Pt元素含量极低且价格昂贵,使得现阶段燃料电池
学位
MXene是近年来发展的一类新型过渡金属碳/氮化物二维纳米材料,其在有机涂料中的应用逐渐引起关注。在MXene的种类、制备方法和性能的简介基础上,总结了其在电磁屏蔽涂料、防腐涂料和多功能涂料制备中的研究进展。报道显示,采用MXene制备的电磁屏蔽薄膜或涂层性能突出,MXene也能显著改善纯环氧树脂或纯聚氨酯树脂涂层的防腐性能,并在多功能涂层中展现出了良好的发展前景,但MXene与涂料各组分的相互作
期刊
随着世界经济进入后工业化高速发展阶段,世界面临的资源紧张和环境污染问题越来越恶化,严重的影响着人们的生活以及社会的进步。为了改进过去传统的工业生产方式,世界可持续发展工商理事会(WBCSD)提出了生态效率(Eco-efficiency)的概念,其核心思想是以最少的资源耗费、最少的废弃物和污染产生,从而创造最多的社会财富。本文通过不同方法评价中国省际静态生态效率、动态生态效率、生态效率空间关联及影响
学位