论文部分内容阅读
深度学习已在计算机视觉领域发挥巨大作用,但深度学习视觉检测算法对船只目标的检测精度不高,深度学习视觉测量算法依赖后处理,总体效果有待改进。本文开展基于深度学习的船只目标检测与视觉测量算法相关应用研究,围绕提高船只目标检测精度与速度、增强视觉测量网络性能展开,取得一系列研究成果。研究了卷积神经网络的基础结构与传播过程,整合分析深度学习优化方法原理、适用背景,为应用研究提供了方法支撑。分析目标检测任务与评价指标,为目标检测方法评估与改进奠定基础。针对船只目标检测速度要求,比较现有的网络框架,基于YOLO V2端到端的检测网络框架,设计船只目标检测框架,以满足检测实时性要求。深入研究了船只目标检测改进方法。针对船只目标缺少训练样本、船只目标检测精度不高、检测时目标大小变化剧烈问题,提出一种基于YOLO V2网络下改进的船只目标检测算法S-YOLO。使用Python爬取网络上船只图片,通过数据增强扩充数据集,利用迁移学习,解决了可获取船只样本数量少、网络难以训练等问题。使用改进的聚类方法确定符合船只形状的检测框形状大小,以获得更准确的精度。构造了混合尺度检测网络,使网络有能力适应船只检测过程时目标尺寸的变化。使用Tensorflow与OpenCV进行编程实验,结果表明,S-YOLO算法对不同尺度的船只检测具有鲁棒性,对船只目标的检测精度和速度优于传统方法。分析摄像机成像模型中图像坐标系、摄像机坐标系与世界坐标系之间的关系,引入相机畸变模型,建立了双目视觉测距模型。利用MATLAB对本实验用到的双目相机进行标定。分析了双目立体视觉测量的评价指标。对目前基于深度学习的视觉测量算法进行分析,明确现有基于深度学习立体匹配算法存在的问题,为算法改进提供方向指引。深入研究了基于深度学习的视觉测量改进方法。针对目前基于深度学习的视觉测量算法存在的精度不高、需要复杂的后处理等现实问题,提出一种基于深度学习视觉测量改进算法CSSM-CNN。利用平行双目相机极限约束的几何关系设计网络,减小了网络中匹配的复杂度;在网络结构中加入视频分析中常用的3D卷积与3D反卷积,增强了模型的视差图学习能力;通过引入残差网络,提高深度网络在多尺度下的立体匹配能力;使用soft argmin函数取代argmin函数,避免了代价函数不可微分问题,同时使得视差更加平滑。网络的端到端输出就可取得很好效果。而通过左右一致性检测和改进中值滤波的视差后处理后,网络输出的立体匹配效果可以在公开数据集中达到先进水平。提出了一种利用目标检测结果加速视觉测量的方法,在自制数据集上进行实验,验证了算法的可行性。本文深入细致地研究了基于深度学习的船只目标检测与视觉测量方法,对船只目标检测与视觉测量系统建设具有技术指导作用,相关方法具有通用性,可推广应用至其他类似计算机视觉问题。