多视图场景下船舶目标检测识别技术

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:pootcat
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究的面向多视图船舶目标检测优化技术主要涉及到水面舰船目标的定位识别、迁移学习和半监督学习等技术,本文的目的是通过实际场景的特点解决不同场景下船舶检测任务的难点,其中包含航拍俯视图场景与光学摄像头前视图场景。本文研究内容如下:1)针对基于无人机成像的俯视图场景数据中存在的复杂背景以及船舶目标特征过拟合问题,本文提出了特征图增强网络。以常规目标检测网络结构为基础,特征图增强网络通过自适应特征图掩码模块生成特征图掩码进行对抗式模型训练。此外,特征图增强网络的特征图海陆分割掩码模块预测水陆区域分布,对模型训练以及预测过程中生成的特征图进行增强。由于充分利用特征图的语义信息和空间信息,特征图增强网络是一种有效减少虚警和漏检的方法。2)针对前视图场景下船舶检测任务,本文着重研究遮挡与小目标情况下船舶检测。为了应对遮挡难题,本文提出遮挡信息提取网络,该网络可以学习遮挡区域的特征。在模型前向推理的过程中,遮挡信息提取网络负责进行遮挡区域的预测。最后在模型后处理的过程中,该网络利用这些预测结果对模型常规输出进行修正。为了提高模型对小目标的准确率,本文提出了自适应区域放大网络。该网络通过提取样本特征,学习其中小目标的分布情况,筛选出原样本中可能出现小目标的区域。通过对这些区域进行上采用,目标检测网络能获得更准确的小目标检测结果。此外,本文分析了前视图场景下数据增强策略存在不合理,以此为依据本文提出了水面马赛克数据增强能够更好的适应前视图场景。3)针对现实场景中标注数据稀缺这一缺陷,本章节利用迁移学习与半监督学习在样本受限的条件下训练网络模型。本文利用船舶俯视图与前视图中视角变化之后仍存在大量相似特征的特点对模型进行两视图之间迁移学习,其中使用冻结网络层与知识蒸馏的手段提升模型的训练效果。为了利用大量未标注数据,本文使用了基于半监督学习的伪标签方法以增强模型训练:首先以Mobilenetv3为特征提取部分,训练一个常规目标检测网络。令其对未标注数据预测生成伪标签,之后根据样本分布选择标签加入训练集对模型进行二阶段微调训练。这两种办法使模型学习到更多样的特征,能有效提升模型的检测性能。
其他文献
飞机是遥感图像中重要的军用和民用目标,飞机的型号、数量等空间分布信息具有重要的应用价值。对飞机进行准确快速的侦察定位是获取信息战主动权的关键之一,为后续决策部署提供重要依据。SAR影像能穿透云雾,不受天气影响,是获取军事情报信息的重要来源之一。随着SAR影像分辨率不断上升,SAR影像的解译已经广泛应用于目标侦察、地形变化监测等领域。论文以SAR图像飞机目标的遥感侦察为研究对象,分别在检测和细粒度识
学位
在目标多样化、环境复杂化的探测背景下,单一的探测模式往往有一定的局限性,论文工作基于课题组采用的一种多模态的探测方案,将红外图像探测与光谱探测的优势相结合,此前图谱关联探测设备研制已经经历了四个阶段,其中前三阶段设备为地基探测设备,第四阶段设备为空基探测设备的首次尝试,为满足新要求空基载荷条件下轻小型化、高实时性的要求,需开展满足新阶段要求的设备研制。论文对新阶段下图谱关联探测设备小型化信息处理系
学位
现代制造业对生产过程的智能化与信息化水平提出了更高的要求,机械臂抓取、自动化装配、自动化测量等应用都对物体识别与姿态估计技术有广泛需求。与二维图像相比,三维点云可以得到物体的深度信息,因此利用三维点云可获得更高精度物体姿态,从而满足实际应用需求。基于双目视觉技术获取的三维点云数据,论文应用深度学习技术对物体识别和姿态估计技术进行研究,主要工作如下:针对物体完整三维点云采集难度大和视角差异带来的点云
学位
中华优秀传统文化博采众长,包罗万象,为高中思想政治课教学的开展提供了丰富教学内容与科学的价值指引。习近平总书记也多次指出:文化是国家或民族的灵魂,文化强则国强。这体现了国家日益重视中华优秀传统文化所具有的育人价值和时代价值。高中思想政治课作为传承与创新中华优秀传统文化的重要载体,已逐渐关注到中华优秀传统文化与其教学理念所存在的内在契合性,因此如何科学全面地将中华优秀传统文化融入高中思想政治课教学是
学位
机载成像设备对地扫描成像是获取遥感图像的重要方式,通过对扫描获得的序列图像进行拼接,可以获得高空间分辨率的全景图像。机载扫描序列图像拼接是全景图像拼接中的一个热点问题,在高空侦察、农业监测、灾害救援等应用方向具有非常重要的研究价值。然而,现有拼接算法计算量大,在运行效率上难以匹配机载成像设备的图像采集速率。其次,大规模序列图像拼接容易产生累积误差,导致拼接结果出现“重影”。此外,全分辨率拼接全景图
学位
中国作为世界上最大的制造业国家,每天都会生产大量的工业产品。其中,纹理表面是一种常见的属性。对于一些基础性材料,如织物、木材、瓷砖等,其表面缺陷不仅影响产品外观,对使用性能也会产生负面影响。随着质量检测需求的不断增长,如何对大量产品表面进行及时的、高质量的缺陷分割成为了工业质量检测中的关键环节。传统的图像分析技术针对性太强,无法在多种纹理表面上建立统一的分割模型,而神经网络因其强大的表征能力成为纹
学位
无人机有高机动性、小尺寸和易于控制的独特优势,在各领域扮演着愈加重要的角色,无人机的路径规划问题已经成为当下研究的重点。然而在复杂且感知范围有限的三维环境下进行实时规划时,需要不断根据环境改变而生成新的安全可行路径,因此算法效率至关重要。考虑到最优路径搜索会消耗很长时间,本文提出了一种基于动态启发的混合A*算法解决无人机实时避障三维路径规划问题。首先对无人机在实时规划中的环境数据管理方法以及约束条
学位
动车检修能及时发现零部件潜在故障并进行维修,为动车的正常运行提供保障。开展动车缺陷智能检测研究,实现缺陷的自动定位、识别与告警,可以代替动车检修中大量重复的检测工作,提高检修效率,缓解检修工人的工作压力。目前国内采用的动车组运行故障动态图像检测系统雨天采集图像质量差,误检、漏检严重,检测效能难以充分发挥。本文面向动车缺陷检测中的裙板螺栓,开展裙板图像采集系统、螺栓缺陷检测算法以及软件的研究,设计并
学位
车辆作为现代交通运输的重要载体之一,广泛应用于军事和民用领域。红外图像由于具有全天候工作、抗干扰性强等特点,在战场态势感知、智慧交通及视频监控等领域得到了广泛应用。为解决计算资源和存储资源受限条件下的车辆目标检测与识别算法模型的部署问题,开展红外遥感图像车辆目标检测识别及其轻量化研究,具有重要研究意义和应用价值。论文主要工作如下:针对当前机载公开红外图像车辆目标数据集稀缺的问题,论文根据实际项目研
学位
论文涉及一种针对卫星图像的多模态数据处理系统的设计与实现。针对星载红外目标监视图像数据率高与星地数传带宽有限的矛盾,以及星载资源受限下的数据实时处理传输难题,论文研究了多模态数据处理传输方法及其FPGA实现技术,提出基于弱小目标检测的动态感兴趣区域提取、静态感兴趣提取、抽帧全域/静态区域/动态区域数据调度下传技术,完成了基于FPGA的硬件设计与实现,具体内容如下:首先,针对数据传输带宽有限的难题,
学位