论文部分内容阅读
随着机器学习、人工智能、网络技术的发展,各个领域对大数据和深度学习的研究和运用越来越多。卷积神经网络算法以其特有的局部连接、权值共享的特性,在深度学习研究中占据着极其重要的位置,并且由于卷积神经网络算法中的卷积过程能够自动快速地学习到图像的特征,因而在图像分类任务中表现出极大的优势。随着对深度学习和图像分类不断地进行深入研究,卷积神经网络算法在图像分类任务中仍存在着一些不足,如在不同任务中,相同算法模型的分类能力强弱不等,不具统一性和普适性;在建立分类模型阶段,由于用来实现图像分类任务的卷积神经网络的并没有具有严格理论支撑的普适通用的模型结构,要想确定分类模型结构,必须通过大量的实验研究进行选择和优化;卷积神经网络对训练样本的规模要求严格,一旦训练样本数量少就会出现模型分类精度低的现象;由于激活函数在卷积神经网络算法中有着极其重要的作用,如果选取不当必会降低模型的分类准确率,激活函数的选用是否合适直接影响着网络分类性能的好坏。是提高网络分类性能的关键。在卷积神经网络中,不同的激活函数都有各自的优缺点,如线性激活函数不能使模型具备良好的多分类功能,非线性饱和S型激活函数能满足多分类的需求,但是极易使网络训练出现梯度消失的问题,非线性分段函数Relu能避免梯度消失问题,但却容易是网络出现神经元死亡的问题等,如何选择和使用最佳的激活函数在基于卷积神经网络的图像分类中是一大难点。针对卷积神经网络在图像分类中存在的问题以及常用激活函数存在的不足,本文对卷积神经网络算法中的激活函数、网络模型结构进行研究和改进,以求提高图像分类的准确率以及增加模型的稳定性和通用性。具体的研究如下:(1)通过对激活函数的研究,分析多种常用激活函数在神经网络中的利弊,针对修正线性函数Relu对网络中的负激励的强烈抑制特性及双曲正切函数Tanh对网络造成的梯度消失的问题,提出具有软饱和-线性结构的激活函数T-Relu函数,从而提出改进的卷积神经网络算法TRCNN,根据激活函数及算法的理论推导,证明了软饱和-线性结构激活函数T-Relu能使TRCNN算法具有更好的特征学习能力。(2)基于对卷积神经网络模型的认识和研究研究,通过大量的实验,逐步确定基于TRCNN算法的卷积神经网络卷积-卷积-采样的模型结构、8层的网络深度和防止过拟合的dropout-L2的组合方式,构建本文的图像分类模型Typ-CNN,应用到自建的台风等级卫星云图的分类中,分类精度达到83.72%,比传统的CNN模型的分类精度高2.3%,从而证明了Typ-CNN模型具有良好的分类效果。(3)最后通过在Typhoon数据集、MNIST数据集和CIFAR-10数据集上进行多组实验对比,分别得到84.17%、98.64%和72.34%的分类正确率,同等条件下优于其他几种激活函数作用下的CNN算法分类效果。证明了基于T-Relu激活函数的TRCNN算法的可用性。综合所有实验结果可知,基于不同激活函数的CNN算法在相同数据集和分类模型结构的条件下分类能力不同,基于相同算法和网络结构的分类模型对不同数据集的分类效果也不同。