论文部分内容阅读
图像作为人类感知事物的视觉基础,是人们从外界获得信息的重要依据,所以让机器自动完成图像识别、分类具有重要意义。图像分类最重要的部分是特征提取,研究高效的特征提取算法在图像领域至关重要。深度学习(Deep Learning, DL)是多层的网络结构,它通过建立、模拟人脑的分层结构,对外部输入的声音、图像、文本等数据进行从低级到高级的特征提取,所以深度学习在图像分类领域具有广阔的应用空间。而深度学习本身存在训练时间过长、过拟合等问题,本文以提高深度模型分类精确度、缩短训练时间和防止模型过拟合三个问题为出发点,主要研究工作如下:首先,本文研究了极速学习机(Extreme Learning Machine,ELM)作为卷积神经网络(Convolutional Neural Network,CNN)分类器的可行性与意义,进而提出了混合深度模型CNN-ELM(Convolutional Neural Network-Extreme Learning Machine)。先用原始的CNN训练网络,然后用ELM替换CNN的输出层完成最后的分类,混合模型结合了CNN有效提取图像特征和ELM快速高效的特点,使得两种方法能够协同工作,实验表明CNN-ELM提高了CNN的分类精确度。其次,针对深度学习方法训练时间过长的问题,研究了随机参数网络结构的可行性与意义。核极速学习机是在ELM的基础上引入了核函数,具有更好的分类效果,从而提出了基于核极速学习机的随机参数深度模型:卷积极速学习机(Convolutional Extreme Learning Machine with Kernel,CKELM)。在模型CKELM中,把随机权值的卷积层和降采样层作为隐含层,来提取输入图像的显著特征。实验表明该算法既保证了分类精确度又大大缩短了深度算法的训练时间。最后,本文研究了基于DropConnect的深度自动编码器算法的应用意义和可行性。DropConnect作为一种新型的正则化方法,在处理过拟合等问题上表现突出,所以文章提出了一种基于DropConnect的深度自动编码器模型DDAE(DropConnect Deep AutoEncoder)。实验表明将DropConnect思想引入自动编码器中有效的提高了算法的性能。