基于深度生成模型的可控人物图像生成算法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:chanstan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人工智能技术与时尚产业的融合发展已成为热门话题,它旨在利用人工智能技术辅助传统的时尚产业,助力时尚产业的数字化转型。针对时尚领域的不同应用场景,人工智能技术的探索和落地层出不穷,虚拟试衣和时尚智能设计是其中的两大热门方向。本文主要研究内容为基于深度生成模型的可控人物图像生成算法,针对人工智能在虚拟试衣和时尚智能设计中的应用,开展了以下两方面研究:针对人工智能在虚拟试衣中的应用,本文提出了一种姿态引导的可控人物图像生成算法。现有虚拟试衣任务中的姿态转移相关工作使用成对的源-目标图像数据集进行训练,通过整体特征转换实现姿态变形,存在训练数据及使用场景受限的问题。本文提出了一种新颖的自监督分区域特征归一化方法,使用源人物图像作为监督信息,通过解耦时尚人物图像的姿态和外观信息,允许用户灵活地操纵姿态和外观属性,以实现人物图像的姿态转移和对人物图像外观属性的控制。实验结果表明,与目前现有的基于监督学习的姿态转移方法和基于无监督的姿态转移方法相比,该方法在生成真实可控的人物图像方面具有有效性和灵活性,为虚拟试衣任务的实现提供了新的解决方案。针对人工智能在时尚智能设计中的应用,本文提出了一种多模态条件引导的可控人物图像生成算法。现有时尚智能设计相关工作关注单一人物图像的单视角生成,使用端到端的卷积神经网络实现一对一映射,存在图像生成效果单一和可控性较差等问题。本文提出了一种新颖的服装智能设计方法,在输入人体姿态和纹理图案的条件下,可以生成多视角的多样化时尚人物图像,用以替代时装设计师重复和低级的设计工作。首先,通过语义生成网络获得多样化的人体语义信息;其次,使用纹理生成网络将输入的纹理图案转移到上一步骤生成的语义布局中;最后,利用外观流生成网络将单一视角的人物图像转换为多视角人物图像。实验结果表明,该方法有效地解决了具有挑战性的多模态图像翻译问题,为时尚智能设计任务的实现提供了新的解决方案。总而言之,本文围绕人工智能在虚拟试衣和时尚智能设计中的应用设计了两个实用新颖的深度生成模型,并且进行了相关的实验分析,证明本文所提方法的有效性和实用性。
其他文献
报纸
报纸
报纸
报纸
随着5G技术研究趋于成熟,为追求更高的频谱效率以及更高的网络传输效率,各个主要国家和研究机构先后启动了第六代移动通信技术的研发。可重构智能反射面(Reconfigurable Intelligent Surface,RIS),由于其无源可控的特性,颠覆了传统无线信道随机,不可控的特点,被视为6G技术的一个关键的新型物理层技术。我们可以通过设计智能反射面的反射相移参数,以满足特定无线通信环境中的传输
学位
为解决传统C语言程序设计课程实践性强、难以融入课程思政元素的问题,探索OBE理念下五维课程思政体系建立和融入的方法。阐述课程思政元素融入C语言控制软件编程基础课程的具体实施,包括聚焦课程目标、挖掘课程思政元素、融合OBE理念的教学设计、设计多位一体的过程化评价方式和持续改进方法。实践证明收效明显,对计算机类大课的课程思政设计、评价和改进提供参考。
期刊
党的十九大提出实施乡村振兴战略,有效建立农村集体经济组织是落实乡村振兴战略的重要路径之一。负责任、透明化的财务治理是国家乡村振兴战略的一部分,但财务治理和会计工作作为农村集体经济组织发展过程中重要的基础性环节,其相对应的会计制度却明显落后于目前的发展改革趋势。文章首先回顾了中国农村集体经济组织会计制度的变迁历程,并对现行相关会计制度中存在的主要问题进行了剖析。针对这些问题,文章总结归纳了日本、韩国
期刊
城市商业银行为了满足日益增长的消费需求和消费人群,将消费信贷作为其零售业务中重中之重的业务进行开拓和发展。在拓展消费信贷的业务的同时如何有效的规避有可能和极有可能发生的信贷风险和消费信贷逾期是每家城市商业银行所面临的难题。本文阅读了相关文献其中有美国的信用评分系统的有关理论和说明,英国的信用评级和用户识别说明,以及我国的大型商业平台阿里巴巴和京东商务的用户评分系统说明结合相关消费理论和个人信用的理
学位
期刊
期刊