论文部分内容阅读
大多数图像处理方法都采用监督式学习算法,而监督式学习对图像数据要求较高,需要大量标签,导致人工成本急剧上升,而无监督学习则降低了对图像数据的人工标记要求。生成模型即是一种无监督学习算法,同时,也是一种典型的深度学习算法,具有很好的语义理解能力。生成模型能够学习到真实数据的分布,并能从中采样出逼真的样本。生成对抗网络(Generative adversarial networks,GAN)是主流的生成模型之一,采用博弈思想,用深度学习构建出一个生成模型和一个判别模型,让它们进行对抗学习,通过彼此的反馈不断提高自身的能力,最终生成高质量的数据样本。本文基于生成对抗网络模型的基本原理,针对原始生成对抗网络中训练不稳定的问题,并模拟人类作画的过程,提出了融合Wasserstein距离的循环生成对抗网络模型(Wasserstein generative recurrent networks,WGRAN)。本文的主要创新点和研究成果如下:(1)模拟画家作画时反复迭代、多次修改的过程,提出循环结构生成模型,采用“多次生成”的方式生成样本。t时刻的生成样本在t-1时刻生成样本基础上添加细节,将最终时刻的生成样本作为生成器输出。区别于GRAN将所有时刻的生成样本进行叠加计算后作为最终的生成样本,这在保证生成图像质量的前提下还减少了生成器的计算量。(2)GRAN模型采用原始GAN中的min-max目标函数,但是由于该目标函数中距离度量方式不合理造成模型不稳定,从而导致生成样本多样性差或无意义。所以本文选用Wasserstein距离作为新的距离度量方法,采用权重剪枝技术约束判别器的判别能力,提出了WGRAN模型。(3)针对由于权重剪枝技术引起WGRAN模型优化困难的问题,采用梯度惩罚代替权重剪枝,微调目标函数,提出WGRAN的改进模型WGRAN-GP。(4)本文在四个不同类型的数据集进行实验,用生成对抗测评和初始得分两个评判标准分别对生成样本质量和多样性进行评估。通过对实验结果分析,本文提出的模型在相关指标上都得到了较好的结果,从模型生成器生成样本的可视化结果来看,生成样本的质量较高。