基于生成对抗网络的人群密度估计算法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:hsh15811353953
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频图像中的人群分析任务是计算机视觉领域中的一个重要课题,而人群计数作为人群分析中的研究热点,在智能安防、城市规划、流量监控等领域均得到了相当广泛的应用。现有的人群计数算法可分为两大类:人数回归法与人群密度估计算法。人数回归法包括基于人头或人体的检测类算法和回归类算法,通过学习个体特征预测个体数目,其在场景遮挡较严重、个体与个体之间存在相互重叠的情况下,效果欠佳。人群密度估计算法出现在深度学习兴起之后,利用深度卷积神经网络强大的特征学习和表征能力,其计算结果不仅可用于预测人数,且能生成反映人群疏密分布的密度图。密度图法将人数回归的问题转化为预测整张图的人群密度概率分布,利用人群块的空间信息,学习群体的特征。相对于人数回归法,密度图法能更好地适应复杂又密集的人群场景,故而近几年人群计数任务的前沿工作都围绕基于密度图法的研究工作展开。尽管目前的人群计数算法已经取得了不错的成绩,但人群计数任务本身仍存在着诸多难点。首先是算法对场景的鲁棒性,人群计数算法本身的应用场景复杂多变,不同场景下的背景所带来的误差会在很大程度上影响模型的预测结果。其次,密集的人群图像往往存在严重的遮挡问题以及远近距离带来的多尺度问题,特别是超过500人的人群图像,部分可见的个体可能只占十几个甚至几个像素点,造成漏检或错检。再者是密度图的质量问题,由于卷积网络中包括池化层等带来的降维操作,导致生成的密度图分辨率远小于原图,且传统的?2损失作为目标函数容易造成密度图的模糊现象,不利于反映人群的疏密分布和人数上的统计。因此,如何在复杂的应用场景下得到鲁棒的高分辨率人群密度估计仍是一个富有挑战性的研究课题。本文介绍了人群计数算法的研究背景和发展趋势,针对以上提到的难点问题,我们从模型的角度在以下三个方面做了创新性工作:第一,模型的主体网络采用U-net型的编码-解码结构,其结构能很好地将前景与背景分离,减少不同背景带来的人数预测误差,同时连接编解码器的跳跃式传递层能将编码器学习到的特征有效地传递给解码器,帮助人群密度图的构建和生成。第二,针对人群多尺度问题造成的计数误差,我们提出了跨尺度一致性约束和尺度聚合模块两种方案。跨尺度一致性约束通过最小化两种尺度下预测的密度值残差,从而减小跨尺度误差;尺度聚合模块中卷积核的感受野覆盖4个尺度,能更好地适应尺度变化,学习到尺度自适应的特征,从而减少算法对各个尺度人群的漏检和误检。第三,从应用的角度出发,为了生成能精确反映人群疏密分布的高质量高分辨率人群密度图,我们在网络中不仅有可以学习的反卷积层帮助分辨率的重建,同时引入了生成对抗网络的结构,弥补传统的损失函数引起的模糊和平均的现象,提高人群密度图的生成质量。本文提出的人群计数算法在四个公开的人群计数数据集Shang-haiTech、World Expo’10、UCSD、UCFCC50上进行实验和测试,实验结果表明本文的方法有效降低了人群计数误差,可比拟甚至超过了国际上最佳的人群计数精度。
其他文献
目的:本研究通过检测孕妇血清尿酸水平,根据孕妇血清中尿酸水平的不同,探讨血清尿酸在妊娠期高血压孕妇母儿妊娠结局中的应用价值。并探讨血清尿酸水平对妊娠期高血压疾病妊
电学实验在高中物理这一门课程的教学过程中是不可忽略的一个部分,其对学生的发展将会起到非常重大的影响。目前的高中物理电学实验教学出现不少的问题,教师要善于发现问题,
第一部分目的:探索恩替卡韦经治HBeAg阴性慢性乙型病毒性肝炎的优化治疗方案。方法:回顾性纳入101例恩替卡韦经治HBeAg阴性慢性乙型病毒性肝炎患者,根据治疗方案分为,恩替卡
当今社会科技发展非常迅速,对电力的需求也越来越大,这大大增加了配电网运行的负担,因而导致系统的网损和电压偏移也越来越大,从而影响了电网的运行效率。为了降低配电网的网络损耗,改善电压质量,本文提出了优化配电网络结构以及优化分布式电源(Distributed Generation,DG)有功出力两种方式提高配电网运行效率。由于DG的引入会对配电网的网络架构产生些许影响,所以为了能尽可能的改善优化效果,
随着当前我国利率市场化的大幅度推进、金融脱媒的更深层次演变、以大数据和人工智能为热潮的科技发展以及近来我国金融行业的监管力度加大的大形势下,商业银行的创新正经历着势在必行而又举步维艰的严峻考验。此时研究银行创新的现状以及其对信贷可得性影响,通过银行创新对信贷可得性影响的理论与实证分析,研究银行作为金融中介发挥的职能在银行创新下能否更好地服务于实体经济,用小微企业信贷可得性来检验银行创新是否能以服务
数据新闻是大数据在新闻领域的重要应用,作为一种以数据为核心的创新报道形式,对传统的新闻报道形成颠覆性对比,同时,数据新闻也被认为是传统媒体的一次发展机遇。我国的数据新闻实践以四大门户网站——搜狐、网易、腾讯、新浪为起点,尔后,国内众多传统媒体也纷纷投入数据新闻大潮中,而历经七年的发展,国内数据新闻已经从“热”趋于平稳发展,回归门户网站这一起点,窥其全貌,可以探寻我国数据新闻发展的全过程。因此,本文
学位
[目的]通过调查云南省三个县区肺结核患者的诊疗相关情况和诊疗相关费用,了解患者的疾病直接经济负担,计算灾难性支出发生率,分析肺结核患者疾病直接经济负担、灾难性支出发
在当代云计算平台中,每时每刻都有成千上万的负载在同时运行,这些类型繁杂的负载来自不同的用户,共享着云计算平台中的基础资源。各种不同类型的负载对于云计算基础共享资源的需求往往各不相同,因此在实际运行中,在同一服务器中运行的不同类型负载往往会发生性能干扰,然而商用服务器系统对于这种性能干扰几乎没有防御作用。随着5G技术的到来,各类新型应用开始逐渐崭露头角,这更加剧了数据中心中性能干扰的问题,如何有效地
光波场中包含了强度和相位,其中相位携带了物体更多的信息。虽然可以用CCD摄像机测量光强信息,但相位的直接测量仍是一项相当具有挑战性的工作。因此,需要利用简单可测的强度信息来恢复出相位信息,这就是相位恢复技术。目前,该技术已经运用在光学测量、光学相位显微、X射线衍射成像、自适应光学等众多领域。基于强度传输方程的相位恢复作为典型的非干涉确定性相位恢复方法,建立了光强在传播过程中的变化量与相位之间的定量
[目的]骨结核是最常见的肺外结核,而脊柱结核是最常见的骨与关节结核,约占骨结核的50%左右。脊柱结核主要依据临床表现、影像征象及相关实验室检查做出诊断,但其早期临床表现