基于YOLOv3的目标检测模型优化研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:ZHAOTAON
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,以卷积神经网络为典型代表的人工智能相关技术推进了计算机视觉领域的发展和它的实际应用。目标检测领域也因CNN模型的成功应用而取得了很大的进步,各种先进的目标检测器层出不穷,基于目标检测技术的计算机视觉应用也在快速发展。一阶段目标检测算法YOLOv3更是融合了YOLOv1版本和YOLOv2版本各自的优点,在保证速度水平不变的前提下,在检测精度上也能有所提高,特别在对小目标的检测工作上,针对性地加强了识别能力。其主要的改进体现在:调整了网络结构;利用多尺度的特征对物体进行检测;损失函数部分用Logistic取代了softmax。一阶段目标检测算法YOULOV 3融合了YOULOV 1和YOULOV 2的本质,在保持速度优势的前提下提高了预测程度,特别是提高了对小目标的识别能力,主要改善措施调整了网络结构,利用多维度特征因此,进行目标检查,将目标分类为logistic,而不是softimax。然而,现有的基于YOLOv3的目标检测器也面临着诸多问题和挑战。首先,现有基于YOLOv3的目标检测器在特征融合上存在不足。其次,基于YOLOv3的目标检测器物体参数与候选框参数平衡也有所欠缺。针对上述两个的问题,本文进行了如下研究:第一,本文分析了现有的基于YOLOv3的目标检测器在特征融合上的不足,提出了一种基于特征金字塔结构的目标检测网络YOLOv3+。原有网络是Darknet-53[37],我们会多加一个下采样操作,而且在YOLO层,会增加一个上采样操作,从更高阶层的特征提取特征信息。改进之后,YOLO层现在变成了四层,比以前的三层多一层,所以输出也变成了四层。大量实验证明,与以往基于YOLOv3的目标检测器相比于YOLOv3+的目标检测器能有效提高目标检测性能。第二,本文分析了现有的基于YOLOv3的目标检测器物体参数与候选框参数平衡有所欠缺的问题,提出了两种优化思路:一是将候选框的尺寸与数据集结合分析,作出有针对性的改变,在重新分派候选框时,将尺寸偏大的候选框分派给高阶层特征图;二是针对物体类别和图片分辨率两方面,分别进行上采样和提高图片分辨率的数据处理操作,尽可能排除物体参数对检测结果的影响。由实验结果可知,结合物体参数与候选框参数所进行的优化能够在保证速度的同时有效提高检测的精度。
其他文献
我国国内疫情的反复致使我们与新冠肺炎疫情进入了拉锯战中,可以说我们进入了后疫情时代,疫情的出现导致商业实体经济受挫严重,本文以后疫情时代下郑州商业实体经济的发展为题展开分析:通过对疫情前后郑州商业实体经济情况进行阐述,分析郑州商业实体经济发展的困境原因:第一,电子商务高速发展对于商业实体经济的冲击;第二,郑州商业实体经济配套设施不完善、专业人才不多;第三,郑州商业实体经济品牌建设力度不足、推广效果
随着深度学习的成功应用,计算机视觉领域也有了飞跃性发展。超分辨率技术(Super Resolution,SR)是计算机视觉领域下的一个分支,目标是能够从一张或多张低分辨率图像重构出高分辨率图像,使图像纹理更加清晰、视觉效果更加自然并符合人的视觉感受。目前超分辨率技术已被成功地应用于交通监测、卫星遥感、图像识别与目标跟踪等诸多领域中。本文在基于生成对抗网络的模型上进行改进,设计了一个能将图像分类训练
军用车辆作为战斗人员与武器装备的运输工具,在现代战场中发挥着重要的作用。由于面临的特殊战场环境,机动性能是保证军用车辆发挥运输作用、完成作战目的及提高生存能力的重要前提。随着战场的转移与战争形式的变化,军用车辆在松软路面的行驶特性研究显得尤为重要。在机动过程中,军用车辆的战场机动性主要由车辆与地面的相互作用决定,因此目前的研究重点是轮-壤相互作用。本文结合军用车辆的研究背景,针对现有理论未考虑车辆
海上搜救应急处置能力是海上生命与财产安全的重要保障,同时也是建设“海洋”强国的重要工作内容,开展海上搜救应急处置资源方案生成方法的研究有助于提高我们国家的海上搜救应急处置能力,同时对提高中国的海洋“软实力”也具有积极作用。目前,我国海上搜救应急处置过程中存在搜救效率较低,搜救决策科学性不足以及搜救资源不能合理利用等问题,针对上述问题,本文对海上搜救资源方案生成问题进行了研究,设计了基于“初始优化+
新型冠状病毒肺炎疫情在全球爆发,面对海量的出行轨迹、资源分配和疫情防控等数据,如何从中挖掘出有用的信息对疫情进行联防联控显得十分重要。聚类作为数据处理的基本工具在我国精准施策过程发挥了十分积极的作用。由于非负矩阵的可解释性,非负矩阵分解已成为基于局部表示整体的重要表达形式。它已成为用于聚类任务的数据分析工具。非负矩阵分解(NMF)是用于聚类任务的经典数据分析工具并且通常NMF考虑平方损失来衡量重构
生物医学是关系到人类医疗诊断水平和生命健康的重要领域。生物医学文献作为相关领域知识的重要信息载体,记录着生物医学技术的研究和发展。近年来,生物医学领域的文献数量呈指数型快速增长。对于渴望加入生物医学细分领域的新学者,他们需要进行大量的资料收集、阅读、统计和分析以寻找该领域优秀的学者和出色的团体。面对海量的生物医学文献,现有的在线数字文献图书馆功能虽然支持根据作者相关信息(姓名、机构、邮箱地址)和文
车辆检测与运动趋势分析是无人驾驶汽车应用研究中的关键环节,是进行道路环境感知与运动规划决策的基础和保证。然而检测过程中经常遇到的车辆遮挡等问题,一定程度上影响车辆检测的准确率和碰撞威胁态势分析的可靠性,从而威胁到无人车的安全行驶。鉴于此,本文重点围绕近处遮挡情况下的车辆检测问题,对基于车辆部件的车辆检测方法和车辆运动参数估计方法进行了深入研究,并针对性地提出解决问题的方法。论文完成的主要工作为:1
在线教育的出现创造了一个新的教学模式,同时也为学习者提供了更多的选择,通过在线教育,学习者可以不再受时间地点的限制,只要有网络,随时随地可以进行学习,在线教育平台中涵盖了多种教学科目,几乎所有的科目都可以在其中找到教学视频。信息化时代的到来使得社会对编程人员的需求急剧增加,编程开始成为了一个热门学习科目,如今的在线编程教育主要包括三种模式,分别是文本、视频和在线编程,这三种模式都能够为学习者提供相
随着战争信息化、自动化水平的逐渐提升,无人机集群作为新作战形式必定会对未来战场产生深远的影响。为了满足集群作战条件下固定翼无人机快速连续地起飞的要求,需要对无人机快速、安全弹射进行研究。本文采用电磁弹射作为无人机的起飞方式,综合考虑机动性、隐蔽性、全程可控性、弹射周期以及发射成本等因素,设计了一种连发型无人机电磁弹射系统方案,并开展了相关技术研究,主要内容有:分析了连发型电磁弹射系统的性能指标及特
在如今数字信息时代,文字、图像、视频、音频等多媒体数据充斥整个互联网。如何有效管理、分析这些数据具有一定挑战性,这是因为多媒体数据是异质的,即它们的属性、特点皆异。这促进单类型数据(单模)和多类型数据(跨模态和多模态)分析处理技术的出现和快速发展。其中,检索技术是一类典型数据分析处理技术。近期基于哈希方法的单模态或跨模态检索技术成为该图像-文本领域的主流研究内容。单模态检索中查询数据与数据库中的数