基于生成对抗网络的人体局部图像合成方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:tauliwn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在医疗康复、人机交互和公共安全等领域,利用计算机技术理解人体局部图像具有重要意义。为此,一些人脸属性合成和编辑方法以及3D手势估计方法相继提出,并逐渐在相关领域得到广泛应用。现有的人脸属性合成和编辑方法虽能根据属性标签有效合成目标人脸图像,但合成的目标人脸图像质量依然有待提高。为解决此问题,本文提出了一种新颖的人脸属性合成和编辑多任务方法ARU-G AN。此外,为进一步研究人体手部图像,本文对ARU-GAN方法进行改进,提出了一种3D手势估计及手部深度图像合成方法HDR-GAN,具体研究内容如下:1、针对当前人脸属性合成和编辑方法难以根据指定属性标签合成高质量目标人脸图像的问题,本文提出了一种基于ARU-net的多任务方法ARU-GAN。该方法中的ARU-net在编-解码器结构的基础上引入跳跃连接有效融合输入人脸图像的不同层级特征,并在训练时使用对抗正则化项约束潜变量,在人脸属性合成和编辑任务中合成高质量的目标人脸图像。为进一步提升合成的目标人脸图像质量,ARU-GAN采用上述任务所合成的目标人脸图像对判别器进行联合训练。实验结果表明,ARU-GAN在人脸属性合成和编辑任务中能够根据指定属性标签合成高质量的目标人脸图像。2、通过在上述方法基础上进行改进,本文提出了一种3D手势估计及手部深度图像合成方法HDR-GAN,该方法的网络结构包括3D手势估计网络HPE-GA N和手部深度图像合成网络HDG-GAN两部分。其中,由编码器和判别器构成的HPE-GAN通过对抗训练对RGB图像中受遮挡的手部进行较准确的3D手势估计。同时,由解码器和判别器构成的HDG-GAN可通过同样的对抗训练方式将给定3D手势合成为相应的手部深度图像。最后,本文对3D手势估计和手部深度图像合成结果进行了定性和定量分析,并利用HDR-GAN初步实现了基于RGB图像的手部深度图像重建任务。
其他文献
当前,我国正处于加快推进现代化、深化经济发展、促进社会发展转型的重要历史时期。然而伴随着快速的城市化、工业化,我国的环境风险事件频繁发生,造成严重的环境污染,导致环
装配式结构具有节能、环保、建造周期短等的特点。为了响应“十三五”规划的号召和实现建筑工业化的目标,大力推行装配式结构是我国建筑业可持续性发展的必然之选。目前,存在
随着新课程改革的推行,各种新型教育方式逐渐出现在课堂教学中。智慧课堂是通过先进的教学理念与先进的教学设施开展的一种新型教学模式。因此,在初中英语教学中,构建智慧课
随着人工智能在科研领域的快速发展,深度学习技术得到了普遍应用,手势识别技术在日常生活中提供了很大的便利。哑语手势识别技术有助于聋哑人与非聋哑人之间的智能交流。然而
本文开发了一种控制精度高、操控灵活、传递精度高、方便实用的转向控制系统以代替中大吨位汽车起重机底盘机械拉杆转向技术,并解决多拉杆系统存在的整机布置困难、杆系占用整机空间大、杆系转向变形大、操纵稳定性差、轮胎易磨损、转向系统维修性差等问题。论文完成的主要工作内容如下:(1)转向机构运动学优化分析。通过多体动力学理论,建立了转向机构模型,完成了约束设置、驱动仿真和设计优化分析。(2)根据优化分析后的转
广州4,5号线直线电机型转向架是我国中车青岛四方股份有限公司(以下简称四方股份)引进欧洲庞巴迪的转向架技术,具有过曲线能力强、爬坡性能好、工程造价低、振动噪声低等特点
如今,磁共振成像(Magnetic Resonance Imaging,MRI)是一种不可缺少的临床诊断工具。它没有电离辐射,可以提供良好的软组织对比度和多方位成像。然而它的发展受限于其较慢的成
固定开关频率脉宽调制已经被广泛应用于工业控制中,但是由于固定开关频率从而产生高频的离散谐波和电磁噪声,针对这一问题,随机调制技术近年来引起了学者们广泛的关注,并且已经证明随机调制技术能够有效降低电磁噪声,本文将从理论、仿真以及实验对随机调制技术进行研究。本文首先对永磁同步电机的相关理论进行研究,分别研究了永磁同步电机的数学模型、控制方式以及调制方式,并重点对比分析了永磁同步电机的SPWM调制和SV
近几年,移动机器人技术发展迅速,并在工业、农业、军事等领域得到广泛应用。机器人精确的位姿估计是实现自主导航和智能控制的基础,也是该领域研究的热点问题之一。视觉传感
数据查询是无线传感器网络完成监控和侦查任务主要手段。因此,无线传感器网络需要通过数据隐私保护技术防止信息泄露和被篡改,利用数据管理技术来完成数据查询和访问控制等任