论文部分内容阅读
现在是大数据时代,随着计算机性能的不断提高与科学技术的不断进步,深度学习已经成为了新的研究热点并取得了突破性的研究成果,在图像处理、自动驾驶、语音处理和自然语言处理等领域都得到了广泛的应用。卷积神经网络是一种常用的深度学习算法,在图像处理尤其是图像识别上有很大优势,表现出了很好的性能,可以说是目前最好的图像识别方法之一。相较于传统的图像识别方法来说,卷积神经网络可以直接将图像作为网络输入,通过逐层的运算与传递,自动提取到具有辨别性的图像特征,最后经过分类器完成识别过程。整个流程避免了传统方法中过多的预处理与人工选择特征的复杂过程,完成了端到端的图像识别。本文结合卷积神经网络的基础理论进行图像识别,旨在设计提高识别率与精简参数的网络,通过结合近几年卷积神经网络的经典结构,并进行反复调参与不断优化网络得到了好的训练模型,最终实现了提高网络准确率与减少参数的目的。本文的主要研究内容与创新点如下:(1)介绍了卷积神经网络的基本概念,主要包括工作原理、反向传播算法与整体结构等;简述了深度学习的Caffe框架;对数据预处理如尺度归一化、去均值与数据增强做了介绍。(2)结合目前卷积神经网络的发展设计了MyNet网络为基准网络用于图像识别,为了提高网络的识别率,对基准网络进行改进并设计了多尺度卷积网络和并行交叉网络。多尺度卷积网络是通过不同尺度的卷积核进行特征提取,然后将不同尺度提取的特征进行融合;并行交叉网络是通过两条通道分别进行特征提取,在特征图尺寸减少之前将两条通道的特征图进行交叉融合。最后将三种网络在cifar10和cifar100数据集上进行实验,结果表明改进之后的网络在这两个数据集上分别可以提高2.11%、2.12%和1.19%、3.32%的识别准确率。(3)为了减少网络的参数,首先分析了Alex Net网络和SqueezeNet网络的整体结构以及相关参数设置,然后借鉴SqueezeNet网络的思想在Alex Net网络的基础上进行改进,并设计了基于级联与融合的轻量型网络模型。该模型主要是将一个卷积层用两个卷积层来代替并通过压缩输入通道数量来达到减少参数的目的。最后在Food-101以及GTSRB数据集上进行实验,实验结果表明改进后的网络在一定程度上减少了网络参数而且在两个数据集上分别可以提高5.18%、6%和1.21%、1.42%的准确率,(4)为了进一步减少网络的参数和继续提高模型的识别率,通过对一些减参技术如瓶颈模块结构和分组卷积结构的分析并结合残差网络的思想设计了两个超轻量的卷积神经网络模型,然后对该模型的特点进行阐述,并详细说明了超轻量网络的基本模块、整体结构以及具体参数设置,最后通过不断优化网络以及在Food-101和GTSRB数据集上进行实验获得了较好的模型,结果表明,设计的超轻量网络实现了减少大量参数与明显提高网络识别率的目的,在两个数据集上与AlexNet相比,分别将网络模型大小压缩到3.3%和2.8%左右,在准确率上分别提高了13%和2%左右。