基于深度学习的行人检测算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lovechenhua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测旨在检测出图片或视频序列中是否存在行人并对其定位,通常用于智能监控、智能机器人以及自动驾驶领域中。作为众多任务的重要前置处理环节,它常常与行人跟踪、行人重识别以及行人分析等技术相结合。因此,行人检测算法的性能密切影响后续任务的效果,提升行人检测算法的精度有着不容忽视的意义。尽管近年来行人检测已经取得了很大的突破,但是仍存在一些问题需要解决,比如严重的遮挡程度、巨大的尺度差异、复杂的背景以及场景迁移等。我们关注于其中两个关键问题:(1)由于行人距离摄像头的远近会直接导致图像中目标尺寸的变化,这就造成尺度差异成为行人数据集中显著存在的问题,这是影响检测器性能的一个关键因素,如何设计一个对尺度不敏感的行人检测器就显得尤为重要。(2)实际使用中通常涉及不同场景,若对所有场景下的数据进行标注存在一定的难度,我们能够获得的数据更多的是无标签数据,如何将有标签场景下的模型迁移到无标签的场景下是值得关注的问题。本文中我们围绕这两个问题展开研究,主要工作如下:在第一个工作中,我们将关注于多尺度特征的提取与融合。多尺度特征表示是解决计算机视觉任务中尺度差异的常用方法,现有方法对于多尺度特征的利用过于简单,导致在检测多尺度行人目标时性能提升有限。我们首先分析了不同尺度特征之间的信息差异,提出了一种跨尺度的双向特征增强模块,利用高底层特征之间的互补性增强不同尺度的特征。为了提取不同层的多尺度行人特征,我们针对行人特性设计了一种基于行人先验知识的多尺度特征提取网络,它更加关注行人区域。最后我们通过自适应的多尺度特征融合方法将不同层的特征融合成最终的预测特征图,使得我们的网络对于多尺度目标有更大的容忍度。在第二个工作中,我们关注于行人检测中的无监督域适应问题。由于实际使用中通常涉及许多不同场景,重新标注这些场景下的数据从头训练存在很多的重复工作。我们希望通过迁移学习将源域数据上训练的有监督模型迁移到无标签的目标域数据上,使得在目标域上也有较好的性能。我们将无监督域适应问题模拟成半监督问题,采用平均教学方法实现源域数据到目标域数据的迁移。通过提升教师模型与学生模型的一致性表示,可以促进教师模型与学生模型共同学习,进而提高在无监督场景下的检测性能。
其他文献
乳腺癌是威胁女性健康的第一大疾病。ABUS(Automated Breast Ultrasound)作为全自动扫描的乳腺癌检测机器,减少了扫描的主观性,但给医生带来了严重的阅片负担,ABUS机器扫描一
本文研究压缩感知中的信号恢复问题.对lp-范数正则化问题,利用连续加权技术和绝对值函数的光滑逼近函数将其光滑化,使用三项共轭梯度法来求解光滑化后的模型.证明了水平集的
产能过剩严重阻碍和制约着我国经济健康的发展,制造业成为产能过剩的重灾区,其中重工业更为严重,这主要是因为重工业大多都是资本密集型行业,实际生产过程需要大量的投资从而
非晶合金作为一种亚稳态材料,由于其微观结构的“无缺陷”—内部没有位错、晶界、相界,不存在偏析、夹杂等缺陷,所以具有比晶态金属更加致密的无序堆积状态,因此大块金属玻璃
传输泵站是煤矿供排水系统的重要组成部分。该设备的稳定、可靠运行为矿井的安全生产提供有力的保证。但其存在能耗、成本、安全、设备监测监控、劳动生产率等方面的问题,为
随着互联网的飞速发展,涉及网络和数据的服务与应用呈现爆发式增长,与此同时越来越多的网络安全风险和问题不断暴露出来。计算机病毒自我复制和传播能力强、破坏力大,从而引
毫米波技术和大规模多输入多输出系统(Massive MIMO)的集成可以增加可用带宽并且提高频谱效率,被认为是未来无线通信系统最有前景的技术之一。但是,由于毫米波频段射频链路功
双相不锈钢因兼具奥氏体铁素体两相组织特点,作为一种高性能结构材料被广泛应用于石化、化工、海水和造纸等工业领域。节Ni型双相不锈钢通过以Mn代Ni来稳定奥氏体相,由于Mn和
相对输出图像,输入图像有时来自单一传感器,或者不同传感器,通过融合技术可以将多幅输入图像组合为单幅输出图像,让其包含的场景信息优于任意一幅输入图像。近三十年来,图像
以水淬镍渣为代表的含铁、硅系废渣年排放量达1000万吨以上,然而我国镍渣的利用率较低、大量堆积在渣场,既造成资源浪费又污染环境。目前国内外的主要研究重点是火法回收其中