论文部分内容阅读
图像识别技术目前已经广泛应用于互联网行业、金融行业、安防领域,相关的模型算法都很成熟。但是,在细粒度图像识别研究上存在很多空白,一方面在于目前的图像识别算法主要集中于研究―大‖类识别,例如区分猫和狗、房子和车辆等,而很少关注于细粒度识别的范畴,例如在同为犬类的情况下区分阿拉斯加犬和和哈士奇。另一方面,采集带有标注信息的细粒度数据过程中通常需要特定领域的专家知识导致非常耗时而且困难巨大,所以细粒度图像识别领域缺乏充足的且精确标记的训练样本。由于训练样本非常有限且子类之间细微的类间差异和较大的类内差异,细粒度图像分类是一项极具挑战性的研究课题。传统的细粒度识别算法通常基于人工设计的特征,例如借助于局部区域位置和关键部位标注点等额外的人工标注信息,才能获得比较好的的分类精度,但是这个过程需要耗费巨大的人力物力。因此,如何充分利用现有的少量标记样本,在不利用人工标注信息的基础上构建分类精度高、泛化能力强的细粒度图像识别模型非常必要。本文针对细粒度图像的识别问题进行了方法研究,主要工作如下:(1)构建细粒度图像数据库,从面向图像识别的公开数据集中构建了Stanford Dogs、CUB 200-2011 Birds和Oxford 102 flowers数据集,用于算法研究和横向比较。(2)重点研究了卷积神经网络算法,对卷积神经网络中的卷积,池化,全连接以及激活函数进行了研究和分析,并对神经网络模型防止过拟合的技术进行总结。最后对五个经典深层卷积神经网络模型如AlexNet,VGGNet,GoogleNet,ResNet,DenseNet的网络结构和主要创新点进行了研究和对比。(3)提出基于卷积神经网络的迁移学习算法。总结了卷积神经网络对于图像特征表示能力和基于深度学习模型的迁移学习准则,设计出基于卷积神经网络的迁移学习算法实现对细粒度图像识别。将ImageNet大型图像数据集上的预训练模型的结构和知识迁移到细粒度图像识别领域,将这些经典模型作为特征提取器,获取细粒度图像的特征表示。然后基于提取的特征构建多层感知机模型,实现对细粒度图像数据的分类。(4)研究了不同结构不同深度的卷积神经网络模型的迁移学习方法对于细粒度图像识别的精度影响。为了防止模型过拟合,研究了在多层感知机模型中加入权重衰减和丢弃法(Dropout)操作来增强模型的泛化能力和提高模型预测准确率。我们给出三个细粒度数据集最优预测模型,并和前人的研究结果进行了对比。实验结果表明,基于深度卷积神经网络迁移学习的特征表示具有非常好的判别能力。使用简单的多层感知机模型作为分类器,我们在各种细粒度识别任务如Stanford Dogs、CUB 200-2011 Birds和Oxford 102 flowers数据集上都取得非常好的分类效果。在所有数据集上,我们的方法都表现出比前人的研究方法更优的结果,并将识别率分别提高到92.6%,74%和93.8%。