基于YOLOv3的航拍车辆目标检测与跟踪技术研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:hyhlj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无人机相较于固定监测设备有着价格低廉、部署方便、机动灵活等优势,在智能交通信息采集方面具有广阔的应用前景。为此本文在普通城市道路的复杂路况背景下,以YOLOv3算法为基础,对于航拍视角下车辆目标与跟踪技术进行研究,在降低计算资源、加快速度和增强精度等方面做出针对性改进。在车辆检测方面,为了改善YOLOv3算法在航拍车辆检测上的应用效果,本文提出了YOLOv3-Aerial航拍车辆目标检测算法,对默认YOLOv3从网络结构和损失函数两方面提出共五项改进措施。首先,对Darknet基础网络的层次与通道进行适当裁剪,准确率降低有限的情况下大幅提升了检测速度。其次,引入一种改进的空间金字塔池化来池化和连接多尺度局部区域特征,以便网络能更全面地学习目标特征。然后,提出一种改进的FPN网络设计,有效改善了对非机动车小目标的检测效果。进一步,采用焦点损失函数代替交叉熵损失函数,解决航拍车辆数据集中样本类别数目不平衡导致的误检和虚警问题。最后,采用GIOU代替均方误差回归损失函数,缓解了检测包络框位置偏移、重叠不精准的问题。在车辆跟踪方面,设计了一种融合外观特征的改进SORT多目标跟踪算法。针对默认SORT多目标跟踪算法存在目标ID频繁切换、帧间小目标关联错误的情况,提出了一种融合改进空间颜色直方图外观特征与GIOU空间位置特征的数据关联矩阵代替默认的IOU相似度矩阵,从而能更好的通过匈牙利算法最佳匹配密集非机动车帧间小目标,提高跟踪准确度。综上所述,以上改进措施能使检测准确率提升3.51%,检测速度提高3倍以上,小目标跟踪精度提高2%左右,同时能够满足对航拍视频进行实时检测与跟踪的需求,在航拍车辆检测与跟踪等相关领域中具有一定的理论意义和实际应用价值。
其他文献
多标签分类的目的是为一个实例分配多个与之相关的类别标签,其在数据挖掘和机器学习领域是重要的一个学科分支并有着广泛的应用和研究。同传统的二分类问题相比,多标签分类问题主要的挑战在于标签相关性的利用和高维特征的约简。针对这两方面的研究有很多,但是现有的大多数算法仅仅解决了其中一个问题。为此,本文提出两个改进算法,在进行特征选择的同时考虑标签相关性,最后将研究成果应用于安卓恶意应用检测中。具体的工作包括
车辆再识别(Vehicle Re-ID)指的是根据给定车辆图像在跨摄像头车辆数据库中搜索相同ID(Identity)车辆图像的任务,在公共安全和智能交通领域具有广阔的应用前景。车辆再识别有两个主要挑战:由于车辆品牌的影响,会导致相同车型不同ID的车辆外观相似性高(类间相似性高);因为车辆的刚体特性,使得车辆的不同姿态外观差别大,导致不同姿态相同ID的车辆图像外观相似性低(类内相似性低)。其中,姿态
在工业化的连铸钢板坯生产过程中,钢厂针对连铸坯质量的评价与分类依然主要依靠人工经验。本文基于连铸坯冷酸蚀图像中的缺陷进行预处理、分割以及分类识别,为后续研发连铸坯缺陷评级系统提供准备工作。在预处理时,中值滤波和维纳滤波对图像中的噪声可以有效去除,但多次滤波会导致图像信息的大量损失。为解决这一问题,提出一种开关结构下的快速加权中值—维纳滤波器,以减少图像滤波过程中信息的损失,并通过与中值滤波、维纳滤
电弧增材制造技术以电弧为热源熔化金属丝材,基于离散/堆积的成形原理,并沿预设路径逐层沉积制造出3D实体零件,具有沉积效率高、生产成本低等优点。双丝CMT电弧增材制造以两根异种丝材作为填充材料,在CMT增材工艺中熔滴过渡和焊丝回抽相结合的基础上,快速生成多元成分可调合金体系,解决焊丝定制成本高、周期长等难题。本课题以2系Al-Cu焊丝和5系Al-Mg焊丝为填充材料,基于双丝CMT电弧增材制造工艺对A
为了解决在野外环境下测量炮口附近的弹丸飞行姿态时,攻角纸靶法精度较低,阴影照相法要搭建复杂的光路系统的问题,基于三目视觉原理,通过激光摄像法直接拍摄弹丸实像来测量弹丸的飞行姿态,既可以得到精度较高的弹丸飞行姿态,同时也不用搭建复杂的光路系统,相对于双目视觉姿态测量方式也提高了测试结果的稳定性。在对相机的成像原理、相机标定、三目姿态测量模型以及各坐标系间的空间转换关系等分析的基础上进行了三目视觉弹丸
随着“互联网+”时代的降临,办公自动化系统(OA)在信息与技术的不断演变过程中也在不断完备。如何解决企业项目管理、人员管理以及沟通管理等一系列需求,达到其信息化战略目的,打造一款能集项目、人员、沟通等多方管理一体化协作系统平台具有重大的实际意义。本文将针对某企业协作系统,分别从系统架构、系统功能模块和系统测试等多方面进行设计与实现,并研究基于Lucene的Solr检索算法和基于CB的推荐算法为系统
随着城轨列车技术的发展,地铁成为人们日常生活中不可或缺的交通工具,为保证人们出行安全,地铁的安全性不容忽视。车底状态检测是地铁检测的重要环节之一,但地铁段检、厂检会存在漏检情况。当前国内还没有一套完整的地铁底部复现技术和基于图像自动检测技术,因此本文对地铁底部做了相应的研究。主要工作内容如下:(1)对地铁底部图像拼接与关键部件螺栓检测系统进行总体架构设计,在需求分析的基础上,确定系统架构、系统工作
随着机器视觉的发展与应用,将视觉检测技术运用于工业场景中已经成为智能制造业的热潮。钢水浇筑在生产过程中,存在很多不可控的质量问题,在制造过程中会出现部分划痕、形变等瑕疵,而操作人员需要近距离判断检测浇筑钢爪的合格与否,这样的检测方式效率过低。为此本文分析和应用了基于深度学习的目标检测框架进行训练,实现形态各异、多角度的钢爪识别与检测。论文主要完成以下工作:(1)分析了本文检测目标的实际环境和需求,
近年来,随着高清视频采集设备在生活中的普及,单目相机的数据量得到了迅速的增长。如何处理这些数据,从中获得有价值的信息,是计算机视觉领域的一个重要问题。数据中的人物姿态与行为,因其具有巨大的潜在商业价值,成为研究者重点关注的对象之一。近年来随着深度卷积神经网络在多个计算机视觉任务上取得的突破,行人检测、人体姿态估计、动作识别等与人相关的任务也受到越来越广泛的关注。本文聚焦于单目彩色图像数据中的二维人
情感分析是对文本中表达的评论、情绪和情感进行的计算研究。近几年来,情感分析引起了业界和学术界的广泛关注。在世界各地,社交媒体已为人们提供了以母语共享个人观点的趋势。对于这些评论的情感分析,机器学习算法是研究者的主要选择。在提出了复杂的机器学习算法和硬件升级版本来运行实验之后,研究界开始转向利用深度学习完成情感分析任务。过去五年的背景研究证实,深度神经网络(CNN、RNN和扩展版LSTM)取得了显著