【摘 要】
:
基于文本描述生成图像是一个融合了自然语言处理和计算机视觉两大领域的热门研究课题,问题的最终目标是能够根据任意的文本描述生成具有丰富细节的逼真图像。基于文本描述生成图像在自动配图、计算机辅助设计等领域中有着很好的应用前景,同时该问题的研究也面临着很多难题的挑战。近年来,深度学习算法在自然语言处理和图像生成领域有着很好的前景。而不同于一般的图像分类和目标检测等粗粒度的图像理解任务,基于文本描述生成图像
论文部分内容阅读
基于文本描述生成图像是一个融合了自然语言处理和计算机视觉两大领域的热门研究课题,问题的最终目标是能够根据任意的文本描述生成具有丰富细节的逼真图像。基于文本描述生成图像在自动配图、计算机辅助设计等领域中有着很好的应用前景,同时该问题的研究也面临着很多难题的挑战。近年来,深度学习算法在自然语言处理和图像生成领域有着很好的前景。而不同于一般的图像分类和目标检测等粗粒度的图像理解任务,基于文本描述生成图像问题是高度多模态的。其不仅仅需要识别出物体并学习其属性特征,同时还需要对物体间的位置关系特征甚至对象的动作等特征进行学习和理解。由于生成对抗模型可以输出多模结果的特性以及其易用性好且效果显著的特点,本文引入了生成对抗网络。本文在详细介绍了基于文本描述生成图像问题领域中当前较具代表性的两种模型结构,并综合现有的研究的基础上,提出了一种基于生成对抗网络的根据文本描述生成图像的方法并进行了相应的实验。本文的创新点如下:1.提出了 SG-Stack算法。算法采用场景图作为媒介,使用根据文本描述得到的场景图作为输入生成包含多对象的图像。算法使用场景图代替文本描述作为输入,可以更好地学习到对象间的位置关系特征。SG-Stack采用了堆叠式结构,将原问题分解为两阶段的子问题,降低了每一阶段的生成难度,同时使得最终生成的图像包含更多的细节特征。2.使用PyQt工具包开发了一个基于生成对抗网络的文本描述生成图像系统,该系统实现了模型训练和根据文本描述生成图像的主要功能。同时系统还提供了模型训练参数调整及过程可视化展示功能,帮助用户自行完成模型训练。
其他文献
Jackendoff坚持Chomsky生成语法的心智主义、组合性和语言习得理论,但同时指出主流生成语法的若干问题,如语法的深层结构决定意义、句法中心主义、词库和语法的区分等,认为这
700℃先进超超临界燃煤发电技术能够大幅提高机组的发电效率,并减少污染物及温室气体排放,具有非常重要的意义。而利用700℃关键部件验证试验平台对高温材料和部件进行实炉验
语文活动课,是指在教师的组织指导下,利用语文活动时间进行的各种语文知识和能力训练的实践活动,是小学语文教学的重要组成部分,是《新课标》教育理念的具体化。其内涵主要是
研究目的:基于脑卒中给患者及家庭造成的健康社会问题日趋严重、而国内现有脑卒中护理实施尚不规范的现状,通过本研究制定基于最佳证据、涵盖脑卒中不同疾病阶段及健康问题的
本文主要以藏医史为轴线,依据藏医药历史文献和学术成果,梳理古代藏医药与其周边其他地区医药学间的交流交往史。在国内外相关研究成果基础上,重点从医学理论与实践,考证吐蕃
通过对12个供试甜高粱品种(组合)茎秆的鲜产量、总糖含量、总糖产量和籽粒产量的比较,结果为:茎秆鲜产量以A4为最高,达到41 385.0 kg/hm2,茎秆总糖含量以A9为最高,达到11.26%
随着电子商务、电子政务应用的不断深入,信息安全显得越来越重要。身份认证和访问控制技术是信息安全领域的一个重要分支。跨域认证的实现使不同信任域之间的互联、互通、互
鹿茸不仅具有重要的医疗保健价值,而且,鹿茸角每年周期性脱落和再生,生长过程中锯断或损伤也能再生,这种再生现象是哺乳动物中绝无仅有的。因此,鹿茸的发生、发育及再生的机
背景急性心肌梗死(Acute Myocardial Infarction,AMI)是临床常见心血管危重症,常伴发急性心力衰竭(Acute Heart Failure,AHF),AMI后一周内AHF的发病率高达32%-48%,由于AMI后AHF起病急且早期临床表现特异性不高,如何早期诊治对其预后极为重要。研究显示,血清糖类抗原125(CA125)水平与慢性心力衰竭(Chronic Heart Fai
地处夏热冬暖地区的广州常年平均相对湿度达70%左右,冬春交替季节和“回南天”时节相对湿度更是长时间保持在95%以上。卫生间湿环境很大程度上决定了室内环境质量和住户的生活质量,而热水淋浴会在短时间内使卫生间产生的大量的湿气,导致卫生间和休息区的湿环境变差,相对湿度甚至高于“回南天”的室外空气,严重降低室内空气质量。本文对广州某高校及附近小区住户在冬季和冬春交替季节热水淋浴后产生的大量湿气对卫生间及休