论文部分内容阅读
图像分割是数字图像处理领域的一个主要研究方向,在许多计算机视觉应用的研究中作为第一步,起到十分关键的作用。由于图像分割的重要性和困难性,图像分割技术自20世纪70年代以来一直备受研究人员的重视。虽然人们针对各种问题提出了许多方法,但到目前为止仍然没有一个适用于大多数图像的分割算法,也没有制定出标准来选择适用的分割算法。传统的图像分割方法大部分先对图像进行特征提取,然后映射到某种模型中,不仅过程复杂,效果不鲁棒,且往往不能给出语义信息。因此,提高图像分割算法的效率并且提升分割效果具有重要的意义。得益于“大数据”和高性能计算设备的发展,深度学习成为当前人工智能领域的一大研究热点。深度学习本质上是神经网络的拓展,目前在语音识别、人脸识别、物体识别、目标检测等诸多人工智能领域都取得了突破性进展。在计算机视觉领域,深度学习应用最广泛的一种模型就是卷积神经网络。其通过局部连接和权值共享两个特性,大大减少了模型参数的数量,从而使模型可以做到很深的层次。深度学习可以从大量标注图像数据直接学习和提取相关特征,省略过去十分繁杂的建模过程,为许多领域的研究提供了便利。本文就是针对基于深度学习的图像分割方法进行深入研究。基于深度学习的图像语义分割的主要思路是,使用像素级标注的图像,利用上采样、反卷积等特殊层,将普通卷积网络提取到的特征再还原回原图像尺寸,从而实现一种端到端的学习。本文在借鉴已有网络的基础上,提出了一种叫Fast-Seg Net的网络新架构,新架构使用了最新的残差网络结构,结合了稀疏卷积、分解卷积等操作,配合批归一化,将网络深度做到了28层,在提高了精度的同时,依然保持了运行的速度。通过迁移学习的训练方法,加快了网络的收敛速度和精度。另外,本文提出了一套对图像进行像素级标注的工具和流程,并编写了图像像素级标注检查工具,采集了吉林大学校园里的街景,合格标注了1566张照片,并在其上面训练了Fast-Seg Net,取得了不错的效果,平均联合交叉度量m Io U达到了70.2%。