论文部分内容阅读
迁移学习(Transfer Learning)是运用已有的知识对不同但相关领域问题进行求解的一种机器学习方法,目标是从源任务中迁移已有的知识、经验应用到目标领域中。深度卷积网(DCN)受生物视觉认知机制启发,包含多层卷积、池化结构,现已成功地应用于图像识别、目标检测等领域。本文是在深度卷积网的基础上,研究并实现了迁移学习在图像分类中类别拓展和目标检测中目标拓展的应用,其主要的工作内容如下:1.针对各种数据增强方法对深度卷积网图像分类任务的影响,利用各种数据增强方法扩展训练图像样本,选取ImageNet的一个子集和CIFAR-10作为原始数据集,AlexNet作为预训练网络模型。实验结果表明,在相同条件下,小规模数据集通过数据增强后测试准确率明显提升,四种单项增强方法(剪切、翻转、WGAN、旋转)的性能总体上优于其他方法,并且合适的组合方式比其单项更有效。2.针对图像分类任务中类别拓展问题,研究并实现了基于微调的图像分类类别拓展算法和基于特征提取的图像分类类别拓展算法。前者通过将预训练模型和层冻结方法相结合进行模型微调,实现类别拓展;后者通过将预训练模型作为特征提取器,提取对应层的特征,训练SVM分类器来实现类别拓展。实验结果表明,当新加入的类别样本数足够多或者相当时,宜采用微调方法来实现类别拓展,当样本数很少时,将预训练模型作为特征提取器,训练SVM分类器来实现类别拓展。3.针对目标检测中目标拓展问题,研究并实现了基于SSD模型微调的目标检测拓展算法。通过利用目标数据集微调SSD-VOC模型,得到微调后的模型,将微调模型与原始SSD-VOC模型进行级联,实现目标拓展。实验结果表明,微调后的模型对目标域中两类目标检测正确率达到86.8%,级联后的模型实现由20类到22类的目标检测拓展。