基于对抗性生成网络的图像翻译方法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:zolono188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像作为一种信息载体,是人们现代生活中表达情感和沟通交流的不可或缺的方式。在计算机视觉领域中,图像到图像的翻译任务类似于自然语言中的机器翻译,不仅要求根据源域中的图像生成目标域中的对偶图像,而且在翻译过程中需要对生成图像约束,从而保证生成图像和源域中的图像保持一定的相似性。无论是基于监督学习的翻译算法,还是基于无监督学习的无配对图像翻译算法,都成功地实现了两个域之间的图像翻译任务。然而,在涉及多个域的翻译任务时,现有的翻译模型需要对图像域两两分组进行独立训练,这样的训练方法是相当麻烦且耗时的。为了减少训练模型的数量、提升翻译结果的图像质量,本文针对多个域之间的翻译任务提出了两种解决方法。首先,针对人脸面部属性迁移任务,本文提出了一种基于条件投影的无配对图像翻译方法。该方法根据人脸的属性将数据集分为不同的域,并用标签进行标记。然后训练判别器去判别生成模型学习到的特征与目标特征之间的差异,计算生成器学习到的特征信息和条件信息的相似度,缓解了生成器过拟合的问题,促使生成器生成更逼真、自然的图像,并且提高了翻译结果的正确性。其次,借鉴条件生成模型,本文提出了一种基于解耦表示的无配对图像跨域翻译模型。该算法先使用标签来表示域信息,将其作为条件信息和解耦表示结合,然后通过控制域标签实现源域图像到目标域图像的转换。利用域标签可以减少训练模型的数量,仅使用一组生成器和判别器就可以实现跨域翻译,缩短训练时间。此外,输入数据包含不同标签的图像,无形中扩大了训练数据的数量,使得生成器学习到更多的特征。该模型在训练过程中还引入了随机变量,使得生成结果具有多样性。通过和现有的翻译模型的对比,及多个数据集上的实验,证明了所提方法的有效性。
其他文献
近年来,分子机器与圆偏振发光材料广受研究者关注。圆偏振发光指的是有机手性材料发射出不同的左螺旋和右螺旋圆偏振光的现象,其主要研究的是手性有机发光材料的激发态结构信
硒代半胱氨酸(Selenocysteine,Sec,U)是第21种天然氨基酸,由终止密码子UGA编码,通过复杂机制掺入多肽链中形成硒蛋白(Selenoprotein)。硒蛋白广泛存在于生物体中,可以调节机
新疆《某地2号稠油联合站二期工程》项目采用蒸汽辅助重力泄油(SAGD)技术开采稠油,SAGD采出液的温度远高于大罐常温重力沉降法要求的处理温度,因此采用高温仰角预脱水分离器
我国低渗透油田多以陆相碎屑岩储层为主,地质条件复杂,非均质性强,受油藏地质条件等因素的影响,CO2驱开采效果差别非常大,特别是不同地质条件下油藏因素和注气因素不同,会对C
甜叶悬钩子,俗称甜茶、广西甜茶,民间应用历史悠久,多作为茶饮及代糖产品,亦作药用,具有清热润肺,止咳祛痰,消肿生肌等功效。甜茶叶中主要活性物质为甜茶素,还含有多酚类、生
γ-Al2O3是重要的吸附和催化材料之一,水热/溶剂热法是制备γ-Al2O3纳米材料的有效手段之一。“环境友好溶剂”离子液体被用作模板剂,辅助合成多孔γ-Al2O3材料。但是,由于成
刺激响应型材料由于自身物理化学性质可以随外界环境的变化而变化,广泛应用于生物传感、信息加密和信息显示等领域。目前发展比较成熟的光、电刺激响应型材料包括二芳烯和紫
叶绿体(Chloroplast)是植物进行光合作用的重要场所,其直接影响植物光合效率,进而影响植物生物量的大小。除此以外,叶绿体还合成氨基酸、脂类和植物激素,其对植物生长发育至
为了应对快速增长的用户数量以及迅速发展的物联网、人工智能等技术对无线通信系统的传输速率、容量、时延等提出的挑战,第五代移动通信系统(5G)中采用了毫米波大规模MIMO技术以丰富频段资源、提升频谱利用率、增大系统容量。为了充分利用毫米波大规模MIMO系统带来的增益,收发两端需要快速准确地获取信道状态信息。然而天线规模的增大以及混合预编码技术的使用都为信道估计带来了挑战。因此,本文将针对毫米波大规模M
为加速我国隐身技术现代化进程,解决日益严重的电磁污染,高效吸波材料的设计开发已成为当前研究的热点问题。在众多吸波材料,纳米碳材料导电性好,密度低,力学性能优异,是能满