论文部分内容阅读
随着水下机器人技术的发展,水下机器人自主作业技术越来越受到广泛的重视。水下机器人的自主作业技术由多项关键技术组合而成,如水下环境感知、视觉伺服控制、路径规划、水下机器手等。水下环境感知技术是水下机器人的眼睛,对水下机器人的自主作业具有至关重要的影响。水下目标检测与识别是水下环境感知的重要组成部分。传统的目标检测与识别算法具有准确率低、鲁棒性差等缺点。卷积神经网络CNN(Vonvolutional Neural Network)的出现,使得深度学习领域得到了巨大的发展,基于深度学习的目标检测与识别方法也展现出了强大的能力。现阶段,基于深度学习的目标检测识别方法相较传统方法展现出了很大的优势。因此,基于深度学习的水下目标检测与识别将会是今后的研究趋势。基于深度学习的目标检测和识别方法依赖于大量的训练样本,对于水下环境而言,获取大量水下图片数据并标注这些数据是比较困难的。因此,如何在样本不足情况下训练一个泛化能力强的水下目标检测与识别模型?同时,基于深度学习的目标识别算法对小目标和可变形目标的检测准确率很低。因此,如何提高水下小目标和可变形目标检测识别的准确率?为解决上述问题,本文对基于深度学习的水下目标检测识别方法进行了研究。本文的主要研究内容如下:1)针对水下训练样本不足的问题,提出了三种针对水下光学成像环境的数据增广方法。海洋湍流会给水下图片造成模糊影响,考虑使用维纳滤波对图像复原处理,然后用维纳滤波的逆过程给复原后的图像加不同程度的海洋湍流影响,增广出一组不同程度海洋湍流条件下的图片。水下目标图片一般通过俯拍得到,不同拍摄视角所拍摄的图片有所不同,因此考虑使用透视变换对图片进行拍摄视角的转换,增广出一组不同拍摄视角下的图片。水下环境光照不足时需要人造光来辅助拍摄,人造光会造成水下图像的光照不均匀现象,因此收集一些经典的水下不均匀光照图像,提取其光照模板,将提取的光照强度模板融合到被增广图像上,增广出一组不同不均匀光照条件下的图片。实验证明,通过这三种数据增广方法,在训练数据不足的情况下,增广得到的训练数据训练出了 一个泛化能力较强的水下目标检测模型。2)由于卷积神经网络几何结构固定,基于深度学习的目标检测方法对可变形物体的检测效果不好。为此,引入可变形网络,使用可变形网络的可变形卷积模块和可变形ROI池化模块对模型进行改进,提高改进后模型的可变形特性。实验结果表明,改进模型提高了对可变形目标的检测识别效果。3)基于深度学习的目标检测算法一般采用最高层特征图进行检测识别,高层特征分辨率较低,预选框获得的信息少,因此对小目标的分类和边框回归较困难。考虑对不同层的特征图进行融合,对底层特征图池化处理降低分辨率,对高层特征逆卷积处理提高分辨率,然后融合低、中、高三层特征图。同时,考虑增加一组小尺度预选框,增加小目标预选框的生成数量。实验结果表明,改进模型提高了对小目标的检测识别效果。