论文部分内容阅读
图像分割技术是计算机视觉中最基础的部分,是一切其他图像处理方法的基础,图像分割技术的好坏在很大程度上会影响后续处理的效果。在人工智能时代,计算机视觉技术已经广泛的应用在诸如无人驾驶、安防监控等领域中,这些技术的诞生都是建立在图像分割的基础上。对图像分割技术的研究已经有了数十年的历史,从早期的图形学处理算法到如今的全卷积网络算法,得益于硬件的发展、计算能力的提升、信息社会海量图像数据的产生以及深度学习算法的发展,以图像分割为代表的计算机视觉技术再次进入了人们的视野。基于深度学习的图像分割算法不断地被提出,与传统的图像分割算法相比在性能和效果上有了质的飞跃,但是依然存在不小的提升空间。本文在经典的全卷积神经网络的变种U-net的基础上进行改进,将U-net与空洞卷积结合,提出一种新的用于图像分割的网络模型——结合空洞卷积的Unet网络(Dilated Convolution Unet,DC-Unet),将原本主要应用于医学图像分割的网络模型推广到更多场景的分割任务中。本网络采用卷积自编码器结构,网络的核心部分主要分为编码器和解码器两部分,编码器对输入的图像进行编码,提取特征;解码器对提取的特征进行解码,还原图像语义。在编码器的输出结果输入到解码器之前,使用多个空洞卷积操作对网络编码的结果进行不同尺度的特征提取、再进行融合,获得了表现力更强的特征描述,有利于对图像中微小目标的检测。解码器与编码器结构对称,在解码器中,前一个网络层的输出结合编码器相应位置的网络层输出作为下一个网络层的输入,充分地利用编码阶段提取的浅层特征,更加精准的对特征定位,输出更高精度的分割结果。为了验证DC-Unet网络模型的实际分割效果,本文在两个公开的图像分割数据集和一个自制数据集上进行测试和评估,并与其他经典的图像分割算法进行对比,实验结果证明了该网络模型具有良好的分割效果。