基于图像到图像转换的半监督行人检测

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:sjzshiyijshan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测是指在给定的图像或视频中,将行人从背景中识别出来。行人检测有着广泛的现实意义,可以应用到各种实际生活场景,如监控系统和自动驾驶。近年来,深度学习特别是卷积神经网络受到研究人员的广泛关注,神经网络的性能已大幅领先传统的基于手工特征的方法。然而,神经网络需要大量的标注数据进行训练,实际生产中标注数据十分昂贵,不能方便获取。本文在半监督学习的设置下,利用仅有的少量标注数据和大量无标注数据,提高模型的检测性能。针对标注数据不足的问题,本文首先利用少量标注数据训练一个弱检测器,收集高置信度样本作为伪标注数据。实际情况中,受制于弱检测器本身的性能,弱检测器产生的高置信度样本不一定是可靠样本。这类不可靠样本会引入大量错误信息,误导神经网络的训练,从而降低检测器的性能。为此,本文使用对抗学习的方法对样本图像进行转换,将不可靠的样本转换为可靠样本,提高训练数据的数量和可靠性。本文提出语义相似性和形状一致性两个正则项来保证生成图像的质量。接着使用标注数据和转换后的可靠样本训练一个样本分类器,用其产生更为可靠的伪标注数据。最后利用伪标注数据重新训练检测网络。本文在三个基准数据集上验证模型的检测性能和生成图像的质量。本文的模型超越了一些先进的行人检测方法。
其他文献
近年来,各类医疗纠纷逐渐增多,伤害医务人员的恶性暴力事件频繁发生,此类暴力案件呈“井喷式”爆发,屡禁不止,对和谐社会的构建产生了巨大的危害,如何有效化解医疗纠纷已成为
随着市场需要日益增长和行业标准逐渐提高,人们对MEMS压阻式压力传感器的性能要求也水涨船高。传统的压阻式压力传感器存在精度较低、温漂较高、灵敏度偏低以及易受到风速效
物联网应用广泛,且往往节点众多,无人值守,面临着严峻的信息安全风险;其感知层节点具有计算能力弱、能耗低和存储空间不足等特点,现有的入侵检测方法难以适应资源受限且不断
具有编码和解码结构的卷积神经网络在语义分割任务中表现出强大的表征能力,并在显著性检测领域得到了广泛应用。在大多数情况下,利用Image Net数据集上预先训练过骨干网的参
自动调制信号识别(Automatic Modulation Recognition,AMR)是解调前的一个复杂且重要的技术,它在电子侦察、电子对抗等军事领域和无线电频谱管理等民用领域都有广泛的应用。
人手作为人类传递信息的重要媒介之一,在计算机视觉领域得到了广泛的研究。在智能汽车场景中,车内人手检测不仅是车载人机交互的基础,还是分析驾驶员行为、研究车辆驾驶安全的基础。为此,本文研究了基于深度学习的车内人手检测算法。综合评估算法的精度和速度,本文基于高效且快速的单阶段目标检测网络YOLOv2提出了Multi-Scale YOLOv2人手检测算法。该算法主要通过三个模块来提升YOLOv2的人手检测
物联网技术的发展,将我们带入了物-物、人-物互联的物联网时代,同时也促进了传统监控系统的更新迭代。但由于物联网各方面的异构性,目前的物联网生态仍处于一个碎片化的状态,
在工业制造领域中,对工件的测量效率和测量精度的要求越来越高,一种由工业机器人和三维激光扫描测头集成的三维扫描测量机器人被逐渐广泛使用。在三维扫描测量机器人中采用测
近年来,随着汽车数量的不断增加,交通事故频繁发生,这给国家和个人带来了巨大的财产损失。目前,研究表明疲劳驾驶是造成严重交通事故的重要原因之一,世界各国法律法规中都明
随着机器视觉技术的快速发展,三维重建技术成为一种工业上物体形貌测量的重要手段。对于弱纹理物体的三维重建,传统方法难以匹配到足够的特征点,导致重建不完整。因此针对视