论文部分内容阅读
随着移动互联网技术的迅猛发展,伴随着微信、微博、手机应用等手机媒体的兴起,以及智能手机、平板电脑以及数码相机等移动设备的大量使用与3G、4G、Wifi等的高速无线网络普及,用户可以方便快捷地上传或者浏览图像。然而,在现实生活中存在大量无标记的图像难以进行搜索和处理。传统的图像分类识别方法效果较差,给人们的生活或者搜索带来很多的使用不便,特别是在复杂环境下对自然图像的分类识别,人们迫切希望在图像识别中能有新的突破。卷积神经网络是热门图像分类别方法(深度学习方法之一),其学习方法借鉴了神经元处理图像的原理。目前的海量图像数据的出现,有了较多的图像样本,随着硬件的提升,正好为神经网络的进行大规模训练带来了很大的机遇。为此,本文基于传统的手写数字的分类框架LeNet-5进行改进,通过在MNIST数据库以及CIFAR-10数据库的分类任务,研究影响卷积神经网络的性能的因素;并根据卷积神经网络重新设计一个深度卷积网络,在Tiny ImageNet数据库上达到很好的分类效果。本文创新工作如下:1.针对应用于图像分类设计的卷积网络模型中如何选择层次结构以及优化算法等问题,我们根据LeNet-5的架构,在其基础上引入一个具有五层结构的卷积神经网络,并应用在MNIST数据库以及CIFAR-10数据库的识别任务中,通过调整改进的卷积神经网络的层次结构、激活函数、下降算法、数据增强、池化选择以及特征图个数来进行比对实验,研究发现卷积神经网络使用池化大小为3*3以及较多的核(64以上)和小的感受野(2*2)、增加层次结构、使用Relu激活函数、带动量的梯度下降算法以及增强数据集后,在一定的实验条件下,将图像分类结果在MNIST数据库降到了1.08%的错误率,在CIFAR-10数据库降到了28.12%的错误率。2.针对Tiny ImageNet数据库中自然图像的分类,通过分析卷积神经网络的影响因素后,总结参数以及优化算法使用的规律,设计一个网络深度层次为16层(不包括池化层)的深度卷积网络,层次中使用了13个卷积层以及3层全连接层。在Tiny ImageNet数据库上相比较Zeiler模型(32.27%的Top-1正确率),本文模型取得了54.38%的Top-1正确率。