论文部分内容阅读
目前,深度学习在图像分类、人脸识别、语音识别、自然语言处理等问题的研究中已经取得了相当好的效果。深度学习优秀的特征提取能力需建立在大量数据的反复迭代上,在很多实际场景中,由于涉及隐私或法律问题导致数据获取困难,或者标注数据的成本巨大、代价高昂,例如在军事领域和医疗领域中,很多数据取自于实验或临床中,得之不易。像这样的研究从标注数据不足的少量样本中去学习的问题称之为少样本学习(Few-shot Learning)问题,本文主要基于少样本图像分类研究少样本学习问题。传统的用于图像分类的深度学习网络需要使用大量数据进行训练,这样的网络用于少样本学习问题时,由于参数过多而训练数据较少,会产生过拟合现象。对于少样本学习问题,目前学者们主要从迁移学习、数据增强、元学习三个方面去研究。本文利用元学习的思想,针对少样本图像分类问题,设计了一个基于度量学习的少样本图像分类网络,并提出了一个曼哈顿距离结合双神经网络的度量学习方法,和其他度量学习方法进行了对比。具体的,通过一个共享权值的孪生卷积神经网络,对成对输入的图像同时提取特征,随后用度量学习的方法对提取的特征向量进行相似度的比较,根据相似度的大小判断样本的类别。在Omniglot和miniImageNet数据集上的实验结果显示,相比于普通卷积神经网络,基于度量学习的少样本图像分类网络在少样本学习问题中有一定的效果。且本文提出的度量学习方法同时关注了特征向量模的大小,因此相较于其他四种度量学习方法分类效果更好,与一些其他基于元学习思想的少样本学习方法相比,本文的方法也具有几乎最高的分类准确率。此外,本文还在基于度量学习的少样本图像分类网络的基础上,使用卷积自编码,结合曼哈顿距离结合双神经网络的度量学习方法,提出了用卷积自编码改进的少样本图像分类网络。具体的,在特征向量层之后再添加一个反卷积网络分支生成原输入图像的重构层,通过减小网络的重构损失去优化提取的图像特征,以提升度量学习的效果。在miniImageNet数据集上的实验结果表明,卷积自编码可以改善基于度量学习的少样本图像分类网络,提升少样本图像分类准确率,且最终分类效果要优于其他几种基于元学习思想的少样本分类方法。另外,该实验从侧面说明基于度量学习的少样本图像分类网络具有可塑性。在未来,可以从以下三个方面对本文研究内容进行改进:1.使用其他少样本数据集、从更多的评价指标上验证算法;2.从度量学习的角度,考虑用其他的度量方式提高网络在少样本学习问题上的效果;3.从优化特征提取的角度,使用更深层、参数更多的网络提升卷积神经网络提取特征的能力,进而提升分类性能。