基于实例分割的行人识别研究与应用

来源 :四川大学 | 被引量 : 0次 | 上传用户:jackluyl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人实例分割是对图像进行实例级和像素级处理的技术,是计算机视觉领域中一项重要的研究任务。当前的行人实例分割存在分割精度不高、缺乏对分割后的行人实例效果检验等问题。本文针对此问题展开研究,主要工作和创新点如下。1.针对当前行人实例分割精度不高的问题,提出了一个行人实例分割与提取网络。网络基础部分,采用单阶段网络设计结构,使用特征金字塔网络提取特征;网络主干部分,分为行人检测分支和行人实例分割与提取分支,利用行人检测分支获取行人的置信度、掩膜系数和位置信息,利用行人实例分割与提取分支生成行人掩膜;最后集成部分,进行行人实例分割和提取以及行人位置校正。在coco数据集和MOT2015数据集上的实验表明,本文网络降低了行人检测的时间,提高了行人实例分割的精度。2.针对当前行人识别中背景干扰的问题,提出了一个基于行人实例的行人识别网络。网络使用改进的残差网络Res Net50来提取特征,然后对特征图进行水平均匀划分,得到各个区域的局部特征,并且对每个区域的局部特征进行单独分类,最后结合各个区域的分类结果得到识别结果。针对当前行人识别数据集中行人特征丰富度不充足的问题,提出了一种自主添加和自查策略,在已有的数据集和特征库上补充新的数据和特征。针对当前行人实例数据集缺乏的问题,本文在Market1501和MOT2015数据集的基础上,生成了背景为黑底和白底两种行人实例数据集。实验结果表明,基于行人实例的行人识别提高了识别精度,自主添加和自查策略对已有数据集和特征库进行了有效扩充。3.在行人实例分割和识别的基础上,提出了一种基于行人实例识别的多目标跟踪算法。算法采用基于检测的多目标跟踪框架,首先使用行人实例分割与提取网络中的行人检测分支进行行人检测,然后利用卡尔曼滤波进行状态预测和相似度计算,接着使用改进的匈牙利算法进行数据关联,最后对跟踪器中身份不明的行人尝试生成行人实例,结合基于行人实例的行人识别网络进行身份识别。在数据集MOT2015上的实验表明,基于行人实例的识别技术可以应用到多目标跟踪场景中,且具有良好的多目标跟踪效果。
其他文献
近年来,民用航空产业进入到了一个高速发展期,未来的空中交通将越来越密集,空中交通管理正成为一个日益重要和复杂的研究领域。4D航迹预测是航空运输系统的核心要素,旨在提高空中交通的运行能力和可预测性,精确的航迹预测可以有效解决空域资源紧张的问题,并在冲突探测与解脱、协同管制等领域具有重要意义。随着数据挖掘与人工智能技术的飞速发展,越来越多的历史航迹数据可用于空域态势分析和监控,将其有效运用于智能空管系
时间性反走样算法具有效率优势,是近年来被广泛应用的实时反走样算法之一。该算法通过将采样点平摊至历史多帧及复用历史数据的方式来实现实时反走样。在时域信息采样充分且历史数据可复用的前提下,该算法能取得和超采样反走样算法类似的效果。然而在实际应用中,上述条件并不一定完全成立。在历史数据不能被复用的情况下,将产生几何走样及重影等问题。除此之外,为了降低显存成本,该算法使用累积帧来代替历史多帧,这将导致误差
随着现代战争不断向着信息化、智能化的方向发展,飞行器自主机动决策技术作为提升战斗机智能化水平的关键技术,也越来越受到世界各国的关注。现代空战环境复杂、态势瞬息万变,能够准确感知空战环境并生成合理决策的自主机动决策方法技术是近几年来军事技术研究的重点。近年来,随着人工智能技术研究的不断深入,深度强化学习方法在多种决策问题的解决上取得了一定的突破,为飞行器机动决策问题的解决提供了新的思路。本文以三维空
终端区是空中交通管制的重要部分,其任务是引导飞行器起飞、降落和有序进离场,随着空域内飞行器数量的增加,终端区空中流量增大,容易导致飞行冲突,引发空中交通阻塞和航班延误,影响飞行安全,因此研究终端区飞行冲突调配具有重要意义。终端区飞行冲突调配是根据当前飞行器参数,判断未来一段时间内飞行器之间的距离是否会小于安全间隔的规定而导致冲突,并对可能的潜在冲突采取措施避免发生碰撞的过程。本文在现有空中管制技术
在低空监视领域中,小型飞行器的机载设备受制于功率和成本,很难准确播报本机的运动参数,只能通过雷达对其进行主动检测。这类小型飞行器具有的飞行高度低、飞行速度慢和雷达反射面积小等特点,极大增加了雷达目标检测的难度。日益增多的小型飞行器造成了许多空管事故,因此,提升雷达对低空空域小目标的检测能力,成为近年来空管领域需要迫切解决的问题。本文针对基于深度学习的雷达目标检测算法展开了深入研究,根据低空目标的特
数字图像一直在信息的传递过程中扮演着重要的角色。如今多媒体信息爆炸的时代充斥了图像和视频等数字信息,同时也存在着包含大量模糊人脸图像的问题。无论是人们日常分享生活、传递信息还是在科研领域中如智能安防、目标或人脸检测或者自动驾驶等计算机视觉任务都需要依托大量清晰的图像,因此将模糊图像重新变得清晰是一个急切且广泛的需求。在图像处理领域中,将图像的模糊主要分为了高斯、散焦、运动、衍射等类型,其中由运动所
光相干层析扫描技术(Optical Coherence Tomography,OCT)因具有非侵入性和微米级分辨率的优点而成为眼科疾病诊断的重要工具。然而,基于OCT技术的诊断存在两个无法避免的问题。首先,采集的OCT图像中存在大量斑点噪声;其次,在采集过程中,为了尽可能避免数据丢失,通常采用低空间采样率进行采样,但由此得到的OCT图像具有较低的分辨率。因此,当前临床上需要可行有效、并能同时实现O
增强现实技术将经过计算机渲染的虚拟物体与真实场景相融合,广泛应用于电影制作、医疗辅助、工业生产、娱乐等领域。为了保证虚拟物体和真实场景融合的真实感,需要渲染虚拟物体时使用的光照信息与真实环境保持一致,实现虚实融合的光照一致性。受可控光源的影响,室内场景中的光照条件比较复杂并且具有动态变化的特点。对室内场景光照的动态变化进行估计,是实现增强现实光照一致性的重要技术。综上,室内场景的动态光照估计具有重
计算机断层扫描(Computed Tomography,CT)能够利用人体组织对X射线吸收率差异进行成像,以无创的方式获得人体的内部结构图像,因此在临床医疗中被广泛应用于疾病的筛查和诊断。由于X射线辐射对人体具有潜在危害,低剂量CT(Low Dose CT,LDCT)逐渐成为了当前CT成像的主要研究方向。减少X光照射剂量和降低曝光时间是目前减少X射线累积辐射的主要手段,然而X射线的剂量减少会引起量
信号调制识别在电子战、通信侦察、雷达侦察、无线电频谱监测与管理和链路自适应等领域有着重要的应用。但如今信道环境越来越复杂且信号调制方式不断增多,如何高效且准确地完成复杂环境中信号调制识别是当前通信各个领域亟待解决的难题。本文以某电子对抗部队非协作通信为背景,针对信号调制识别中传统算法识别性能低、计算复杂度高等问题,基于深度学习对AWGN信道和Rayleigh衰落信道中信号调制识别关键技术进行研究。