论文部分内容阅读
随着以GPU为代表的硬件计算能力的提升、大规模有标注数据集的开放以及以神经网络为代表的深度学习算法的进步,计算机视觉成为越来越多的研究人员的关注重点,深度学习算法被应用到越来越多的场景中,如自动驾驶、智慧医疗、工业检测、人脸识别等领域。图像分类作为计算机视觉研究中的热点,其目标是识别图像中主体信息所属的类别。在实际的应用场景中,由于天气、光照以及采集图像设备的差异导致同一类别的物体在不同的应用场景中图像特征有着较大的差异。将某一场景数据上训练的模型应用到相同分类任务不同场景数据时,会导致准确率的严重下降,与此同时,对不同应用场景下相同分类任务进行数据标注,需要耗费大量的人力物力和时间,严重限制了图像分类算法的推广应用。因此,研究有标注信息数据(源域)上训练的模型如何在无标注信息(目标域)的相同分类任务不同应用场景数据上有较好的泛化能力——无监督跨域图像分类,意义重大。本文目的是深入研究和分析目前主流无监督跨域图像分类算法的优点和不足,目标域泛化性能的影响因素,设计出目标域上泛化性能更好的无监督跨域图像分类算法。因此本文的主要工作和贡献如下:(1)深入研究和分析主流无监督跨域图像分类算法的优点和不足,包括基于域差异的方法,基于对抗学习的方法,基于生成对抗的方法以及基于自监督的方法,在影响目标域泛化误差上界的理论分析的基础上研究进一步提升泛化性能的方式。(2)提出了联合对齐联合优化的无监督跨域图像分类算法,从源域泛化性能,源域和目标域之间差异,联合泛化误差三个方面优化目标域的泛化性能,在VisDA2017、Office-31、CompCars三个数据集上分别实现了 87.9%,91.4%,86.8%的分类准确率。(3)从实现了无监督跨域图像分类系统,既提供了加油站场景下直接应用车型分类系统,又提供了方便的自定义场景训练,提高了系统的通用性。