论文部分内容阅读
随着全球人口的不断增长,海洋资源的开发与利用受到广泛关注。目前,海产捕捞主要依靠潜水员水下作业完成,具有高风险、低效率、高成本的缺点。因此,开发一款自动完成水下目标检测、定位和捕捞工作的水下捕捞机器人对发展海洋经济意义重大。目标检测技术是实现水下捕捞机器人的关键,其结果将直接影响机械的后续规划与控制。现有的目标检测算法主要关注陆地图像的目标检测任务,对陆地图像处理结果较好。但水下图像由于受到图像退化问题、目标聚堆与遮挡问题和数据难以大规模采集等问题的影响,无法仅通过现有方法获得较高的检测精度。因此,本课题从不同角度对水下场景的目标检测问题进行研究,采用Faster R-CNN目标检测框架作为基准框架。本文具体研究内容如下:首先,分析了导致水下图像退化的主要原因,结合两种传统图像增强方法构建了水下风格迁移数据集,在此基础上提出了一种基于生成式对抗网络的水下图像增强方法,该方法利用风格迁移的思想达到了图像增强的目的,实现了水下图像的色彩校正与细节恢复。然后,针对由于目标聚堆导致的数据集难以精准标注的问题进行探究,提出了一种基于水下前景分割的弱监督目标检测方法。该方法由水下前景分割阶段和基于水下前景分割的目标检测阶段组成。第一阶段完成水下前景与背景的分割任务,第二阶段在第一阶段的基础上完成目标检测任务。本文针对第二阶段提出两种策略,分别是均值填充策略和候选区域优化策略。该方法消除了由于数据漏标导致的假负样本问题,能够在数据集标注不够精准的情况下获得较高的检测精度。最后,针对由于水下图像难以获取导致的小样本问题进行探究,通过迁移学习的思想,将海产分类网络学习到的知识迁移到水下目标检测网络中,同时利用空间变换网络对水下图像进行广泛的数据增广,在扩充数据的同时提高了模型对空间变换的鲁棒性。本文基本以上研究内容,设计并实现了水下目标检测系统。通过大量的定性与定量实验验证了所提方法有效性,实验结果表明本文所提方法在水下图像退化严重、水下目标检测数据集数量较少且标注粗糙的情况下仍然可以获得较高的检测精度,提高了现有目标检测算法在水下场景中的性能。