基于条件生成对抗网络的服装生成方法的研究及应用

来源 :东华大学 | 被引量 : 0次 | 上传用户:yangpengjx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,世界已经步入了信息时代,电子商务亦取得了极大的发展,并且越来越成为我们,尤其是年轻人日常生活不可或缺的一部分。在线购买服装也逐渐被大家接受。电商平台的服装商家多,种类杂等因素导致消费者很难找到合适的服装,这很大程度影响了消费者的购物体验。另外,在线购买服装在带给我们方便的同时也带来了一些弊端,比如不能试穿,不像在实体店里能根据衣服试穿效果再决定购买与否。在这个不进则退的时代浪潮下,各电商平台的并驱争先,用户量是衡量各电商平台受欢迎指数的重要指标。用户量越大,流量越大,潜在价值越大。在数据时代,怎么利用互联网上现成可用的海量数据来提高消费者的购买体验,吸引新用户显得至关重要。在过去几年,深度学习中的生成对抗网络取得了极大的发展,与服装产业的结合愈发紧密,应用生成对抗网络生成服装来解决服装产业的难题也成为了主流。利用生成对抗网络和网络上现成的海量数据,来解决消费者在购买时体验不佳的窘境,提升消费者购买欲望,是电商平台提升业绩的明智选择。因此研究服装生成技术不管是对电商平台还是对消费者都有重要的意义。本文基于虚拟换装和服装检索的应用背景,将深度学习中的条件生成对抗网络和注意力机制相结合应用到服装生成上,根据穿在人体的衣服来生成高质量平铺服装图片。本文完成的工作主要如下:1.设计了一种基于条件生成对抗网络的高分辨率服装生成方法。该方法主要基于pix2pix HD模型,首次将高分辨率图像生成模型应用于服装数据集,并且针对该模型在生成高分辨率服装图片时模型训练过程繁琐、训练时间长以及生成结果丢失纹理等问题,提出了改进版pix2pix HD模型。改进主要体现在三个方面:(1)改进损失函数。添加了感知损失,增进生成结果与ground-truth的感知相似性。提出了改良版的特征匹配损失,在计算特征匹配损失时给判别器不同层的特征图分配不同的权重。(2)改进训练策略。采用端对端的训练方式,无需分步训练,简化训练过程。(3)改进网络模型。弃用计算量庞大的多尺度判别器,采用马尔可夫判别器以减少参数量,缩短训练时间。改进版的模型既避免了高分辨率服装生成模型训练繁琐和耗时长的缺点,也解决了生成结果纹理丢失问题,大大提升了高分辨率服装图片生成性能。在定性和定量性能评估中,我们提出的改进版模型均优于原模型,模型训练时间缩短了近一天。2.针对第一个研究成果出现的问题,综合了条件生成对抗网络和注意力机制,提出了一种基于注意力机制的多阶段类别监督的高质量平铺服装生成方法。该方法受到多阶段图像生成方法的启发,在不同的阶段分别处理不同的问题。在第一阶段,生成平铺服装的粗糙图片。(1)引入空间转换模块,克服生成结果形变问题。针对输入人体图片形状与目标形状偏差较大时,对输入和输出进行形状变换,减弱生成服装图片的形变程度。(2)添加类别监督信息,增加生成服装类别的可控制性。针对输入人体图片有多种类别服装时,可能会生成错误类别的服装。将生成结果送入分类器,计算分类损失约束生成方向,解决网络生成的歧义性。在第二阶段,由第一阶段粗糙结果生成高质量平铺服装。(3)提出了一种基于注意力机制的双通路生成器。将第一阶段生成的粗糙服装包含的形状信息和类别信息与输入的人体图片包含的细节信息融合。(4)引入通道注意力模块代替跳跃连接,自注意力模块模拟像素间全局依赖。通道注意力模块选择性地对价值更高的信息所在通道给予更多的关注,过滤躯干等冗余信息。自注意力模块克服小卷积核只具有局部感受野的弱势,获取远距离区域相关性。在我们制作的服装数据集上进行的服装生成实验表明,我们提出的方法在定量和定性结果上都优于相似的其它方法。消融实验和其它附加实验也进一步证明了我们方法的新颖性。3.将我们生成的高质量平铺服装应用于实际应用中。采用当前最优秀的虚拟换装模型CP-VTON,换装结果也证明了我们的网络具有很高的实际利用价值。4.建立了一个有监督的图像到图像翻译的数据集。数据集包含超过34762对图片和10种类型的服装,每对图片包含了对应的类别信息,每种类型的图片的数量控制在2000左右以避免样本不均匀。其中90%的图片对作为训练集,剩下的用做测试集。
其他文献
为了评估国产环氧灌封胶在绝缘栅双极晶体管(IGBT)功率模块封装中的应用情况,选取两种国产环氧灌封胶进行了综合对比,包括对两种环氧灌封胶固化前黏度、密度和凝胶时间,固化后的基本性能、热性能、绝缘性能等的横向对比。分析两种环氧灌封胶的差异,利用其分别封装IGBT功率模块,并对所封装的IGBT模块进行了高温存储、低温存储及温度循环等环境测试。结果表明:两种环氧灌封胶不同的增韧机理、混合比例、固化温度、
普罗科菲耶夫是上世纪最杰出的音乐家之一,他一生创作了大量的优秀作品。《第一钢琴奏鸣曲》(op.1)作为普罗科菲耶夫钢琴奏鸣曲的首作,具有重要的研究和演奏价值。笔者通过分析研究《第一钢琴奏鸣曲》(op.1)的创作背景、音乐特征和演奏技法,对深入了解普罗科菲耶夫《第一钢琴奏鸣曲》(op.1),把握其后期钢琴作品大有裨益。本文分为四章,第一章阐述《第一钢琴奏鸣曲》(op.1)创作背景,主要介绍二十世纪钢
检验检测服务模式发展滞后于检验检测行业发展的重要原因之一就是缺乏针对于服务模式的理论定义。采用概念分析法,以服务模式的定义和检验检测行业的服务特点为逻辑,研究了相关的代表性理论,认为服务模式主要由服务的基本要素和服务的商业模式两方面的内容组成,并深入探讨了检验检测的服务模式,提出了构建检验检测服务模式这一概念的重要意义。
为满足日益严格的全球燃油经济性要求,流量主动控制、缸间钻孔和快速加热等各种先进的发动机冷却技术得以应用。韩国现代汽车公司最近开发了新一代2.0L4缸汽油机,采用了几种新的冷却系统技术。从概念设计阶段到预生产阶段,总结了三维计算机辅助工程(CAE)分析在发动机冷却性能评价中的应用。对缸盖和缸体水套中的冷却液流动进行了研究,找出了最佳方案,并通过优化缸垫孔对其进行了进一步的改进。在制造首台试验发动机之
目的:调查中学生认知情绪调节和愤怒情绪是否在中学生羞耻感与攻击行为之间起中介作用。方法:采用《中学生羞耻感量表》《认知情绪调节问卷》以及《攻击行为问卷》对山西省阳城县473名中学生进行调查,分析羞耻感、认知情绪调节策略、愤怒、攻击行为的关系;认知情绪调节策略与愤怒能否在羞耻感与攻击行为之间起中介作用和链式中介作用。结果:①羞耻感、消极认知情绪调节策略、愤怒和攻击行为之间两两显著相关(r=0.50、
民间美术所蕴含的造型原理、审美意趣以及视觉张力,为绘画艺术提供源源不断的养分。剪纸作为民间美术的重要组成部分,其对绘画的作用不言而喻,尤其对"舶来品"油画艺术的中国化转型起着较为关键的作用。本文围绕我国油画创作中的剪纸造型元素展开论述,分析油画创作中剪纸造型的运用及其理念。
软件定义网络(software defined networks,SDNs)是一种由多种网络技术组成的新型网络结构,由底层的数据平面、中间层的控制平面以及最上层的应用平面组成,具有灵活敏捷的特点,能够自动优化网络资源的利用,尤其适用于网络中流量需求不断变化的应用。软件定义网络与传统网络不同之处在于SDN将网络设备的控制平面与数据平面相分离,因此根据实时动态的网络需求,用户可以通过简单的编程操作对整
随着深度卷积神经网络在图像处理及识别领域的成功表现,人体检测和姿态识别技术理论研究迎来了新的发展方向。基于深度神经网络的人体检测与姿态识别技术降低了对外界设备的需求,为一些场景应用提供强大的理论支撑。本文以乒乓球机器人系统为背景,设计深度学习模型,用于对击球人的人体位置检测和姿态识别及动作分析,并根据识别到的姿态序列建立分类模型,判断出击球运动动作类别,从而预判乒乓球的旋转类型及速度,以此控制乒乓
数学应用题是以自然语言为基础,基于任何学科领域(数学、物理、化学、生物等)的任何数学问题。由于数学应用题类型多样、复杂程度不一,解决这些用自然语言描述的问题,需要对表达式和答案进行适当的推理。因此,自动数学应用题解算器的设计一直是将人工智能应用到教育领域的热门话题。近年来,顶级的数学应用题解算器大多都采用深度学习方法,然而,它们大都存在忽略数据预处理的重要性,缺乏对数学应用题文本数据的时序性考虑等
近年来随着高通量测序的不断发展,RNA转录组测序技术被广泛用于各物种大脑发育的研究中。在哺乳动物中,人类的大脑具有更大的大脑皮层以及更多的折叠沟回。在个体发育的过程中,人脑与人类的思维认知能力也在不断发展,导致人类的表型与其他非人类灵长类动物具有明显的不同。而婴儿出生是在整个个体的发育过程中一个重要的时间节点,对其在个体发育中的分子机制影响了解得还不明确。之前的研究表明,在灵长类动物大脑的发育过程