论文部分内容阅读
自生成对抗网络GAN提出以后,这一方向已成为人工智能方向的研究热点,研究者们提出了很多优秀的想法来对其进行改进。GAN主要被应用于计算机图像和视觉领域,并取得了突出的效果,但与此同时GAN本身还有许多没解决的问题,其中模式崩溃的问题尤其引人关注,它阻碍了GAN的进一步发展。解决模式崩溃有两种常用的方案,通过对网络进行优化使得模型能够更好的收敛,以及强制生成器去生成不同的模式。在本文中采用后者。本文选取了一种基于多生成器的GAN衍生模型来进行改进,以解决其模型中存在的单个生成器模式崩溃的问题以及模型训练过程不稳定的问题,从而使原多生成器模型能够更好的解决模式崩溃的问题。本文对原多生成器模型做了如下三点改进来解决其存在的问题并进一步提升模型的生成效果:1)引入Wasserstein距离来度量两个分布之间的差异,使得模型的训练过程更加稳定并有个指标可以指示训练的进程,同时由于Wasserstein距离比原始的JSD(KL)散度在模式崩溃的问题上有更好的表现,因此Wasserstein距离的引入还可以减少模型中单个生成器出现模式崩溃的概率。2)引入残差块来进行网络的构建,由于残差网络良好的性能,可以帮助减少网络中的参数量并提升模型的生成效果。3)修改原模型中多个生成器的参数共享方案,使多个生成器的最后一层参数不再共享,由于不同类别图片高维特征有较大差异,这样的修改方便各个生成器对不同类别图片的特征进行更为充分的提取。最后,本文通过在多个数据集上的对比实验来评估改进模型的性能。本文通过在MNIST数据集上的对比实验对本文提出的改进方案的可行性进行初步的评估。然后在Cifar10数据集和CelebA数据集上进行对比实验,以验证本文提出的改进模型在更复杂更接近真实生成任务的数据集上的表现,在这两个数据集上本文引入了常用的GAN评价指标IS值,FID值作为评价标准。通过对生成图片效果的对比和引入的评价指标的对比,验证了改进方案确实能够进一步提高本文改进的多生成器模型的生成质量,同时也能使模型更加的稳定。