基于生成对抗网络的人脸图像合成

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:bell900818
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸图像合成是计算机视觉中的基本问题之一,其目的是将自然人脸图像从一个目标域,经过算法合成转换到另一个目标域。它在安防系统、数字娱乐、图像修复、去模糊等领域有着广泛的应用。尽管经过几十年的研究,在面对复杂的自然图像时,图像合成模型的表现仍不尽如人意。合成图像面临的主要挑战是真实性、多样性和与输入条件一致性。鉴于近些年生成对抗网络的出现提升了人脸图像合成的结果,本文在人脸图像合成的两个应用方向上分别提出了基于生成对抗网络的转换方法。本文核心贡献如下:1)为了解决在利用编解码器和生成对抗网络用于面部属性编辑的时候,会导致低分辨率结果而且操控面部属性能力有限。本文从选择性细化的角度提出了一种新颖的面部属性编辑生成对抗网络,设计了多尺度注意力归一化模块。该模块能够专注于编辑要更改的图像属性,同时保留面部的细节。具体来说,本文的方法首先学习一个空间变化函数,该函数将高层特征图映射到归一化层所需的参数图。然后,通过结合残差块,将低层特征图添加到调制后的特征图中,从而使属性细化任务更加容易。在Celeb A和季节翻译这两个数据集上的实验结果表明,本文的方法在属性操纵精度和感知质量方面均具有优势。2)为了解决现有的方法通过素描图像难以生成高分辨人脸照片,并且通常包含伪影。本文提出了一种新的合成框架,能够有效地将人脸素描图像转换为真实人脸照片。该框架结合了Cycle GAN模型的生成器架构,并在网络的瓶颈层添加了注意力模块,能够帮助图像关注需要合成的人脸部分。此外,本文以一种对抗的方式迭代生成由低分辨率到高分辨率的图像。通过对生成器的瓶颈层进行监督,首先生成低分辨率的图像,然后在网络中进行隐式细化,生成高分辨率的图像。在CUFS和CUFSF这两个数据集上进行的大量实验,证明了本文的网络在定量和定性上都取得了显著的改善。
其他文献
社会关系作为我们日常生活中的基本关系,是人类社会特有的现象,随着各类社会媒体的发展,社会关系有了更加直观的表现形式,识别图像视频数据中的社会关系,对分析社会行为来说至关重要。然而,面对如此海量的图像视频数据,如何高效地对复杂场景中的特征和交互信息进行形象化的描述,进而准确地识别社会关系,仍然是一个具有重大挑战性的任务。现有的社会关系识别方法虽然能够识别出场景中的社会关系,但是仍然存在一定的局限性。
基于信道状态信息(CSI)的动作识别近年来发展迅速,与基于图像,穿戴设备等方式的动作识别相比它具有保护隐私,无需光照,方便等优点。但是目前大多数CSI动作识别系统在新环境中使用或识别新类型的动作时,都需要重新收集大量样本并重新训练模型,这大大降低了CSI动作识别的实用性。为了解决这个问题,本文设计了一种基于元学习的CSI动作识别系统,当将其用于新环境或识别新类型的动作时,它只需很少的数据对模型进行
合成生物元件(Bio Brick)是符合合成生物学装配标准的基因片段。合成生物元件数量急剧增长导致数据质量问题变得复杂而有争议。本文通过比较多种机器学习方法,构建数据驱动的合成生物元件质量评估方法,减轻领域内研究人员逐一判断合成生物元件质量的负担。本文从被分类模型准确识别的能力以及与同类型数据形状保持一致的能力,即准确性和一致性两个维度提出合成生物元件质量评估方法。(1)基于准确性的合成生物元件数
多源遥感图像融合是指将同一区域不同传感器的多幅遥感图像加以综合,通过特定的技术合成一幅新图像的过程。合成孔径雷达(Synthetic Aperture Radar,SAR)和多光谱图像因成像机理不同,而具有较大的差异。SAR图像具有强大的穿透力,不受恶劣天气影响,能够全天时全天候成像,表征丰富的地表纹理和结构特征。多光谱图像含有丰富的光谱信息,可以有效识别不同类型的地物信息,具有优越的目视效果。因
协同过滤技术由于其灵活性、高性能等特点被广泛应用在推荐系统中。传统的协同过滤方法基于矩阵分解的方式,对用户和产品表征进行建模,以获得用户对产品个性化的兴趣偏好,但是其性能往往受限于用户评分数据的稀疏性。近年来,随着图卷积网络的发展,基于图的推荐算法成为了研究热点。图卷积网络通过迭代式的邻居聚集方式将图结构信息编码在节点表征中,可以有效的缓解评分数据的稀疏性问题。尽管基于图卷积网络的推荐算法在推荐精
光学成像技术作为人们认识世界的一种视觉方式,已经成为现代社会科技发展一个重要的方向。随着科技的迅速发展,如何解决复杂场景的散射介质视觉成像和获取有效的信息进行目标重建成为当下研究的热点话题。由于光在传输过程中散射效应是无法避免的,光携带的目标信息会发生畸变,因此,传统的光学成像技术受限,造成成像模糊、散斑等问题。近年来,偏振信息与光的强度、相位、波长这三个基本属性应用的领域越来越广泛。偏振信息已被
视频行为分析是计算机视觉领域重要的研究课题,在智能安防、医疗监护、人机交互、虚拟现实、自动驾驶等领域有着广泛的应用价值,其目的是利用计算机检测视频序列中运动数据获得符号化的动作信息,然后从动作符号中抽取动作特征并进行理解从而实现动作分类或检测。然而,由于视频内容的复杂性和行为的多样性,行为分析任务面临着巨大挑战。现有的视频分析方法虽然能够较好地完成相应视觉任务,但是存在一定的局限性。现有识别和检测
随着对地观测技术的不断更新,高分辨率遥感图像的数据量飞速增长,如何高效的从海量遥感图像中提取有价值的信息是遥感从业人员亟待解决的问题。语义分割为高分辨率遥感图像中的每个像素指定一个明确的土地覆盖类别,现已成为地物信息判读的主流方法,并在土地资源规划、环境保护和自然灾害监测等领域发挥着至关重要的作用。由于应用场景的不断拓宽,依赖手工设计特征的传统图像分割算法难以应对日益复杂的遥感图像分割任务需求。因
近年来,随着各国遥感技术的蓬勃发展,遥感卫星的数目越来越多,其空间、时间和光谱分辨率均大幅度提升,在军事侦察、资源调查、灾害监测等领域发挥着越来越重要的作用。由于单一传感器只能提供有限的信息量,为了充分利用多源传感器的数据,图像融合应运而生,合成孔径雷达(Syntheic Aperture Radar,SAR)图像和多光谱图像融合就是其中一个研究热点。SAR图像与多光谱图像融合的关键在于如何提取S
在室内的许多场景,如家庭、办公室都需要对人员进行识别,这对于智能家居、智能安防等领域来说十分重要。人员重识别是指在某设备下检测到某人员,当其再次出现时能够识别出来。传统的人员重识别技术使用基于摄像头的系统,其成本较高、需要巨大的计算量和存储开销,还涉及到了隐私的问题,在多变的外部环境中会受到角度、服装、背景、光线等等因素的影响。热释电红外(pyroelectric infrared,PIR)传感器