生成对抗网络在文本生成中的应用研究

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:chaoyuemengxiang2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经文本生成模型的一般模型是序列到序列(seq2seq)的模型,其核心思想是按序列顺序采样单词来生成文本,其中每个单词都以前一个单词为条件。这类模型对于解决类似于机器翻译的输入与输出具有较强对应关系的问题时是十分有效的,然而,当人们需要对训练时未被观测到的单词序列进行调整时,这种模型所生成的文本质量就会很差。生成对抗网络(GAN)在生成真实数据尤其是图像数据方面取得了巨大的成功,但是,由于生成对抗网络原本设计是用来解决可微输出的问题,因此对于处理离散文本序列输出的问题时仍然存在不小的挑战。本文提出了使用transformer网络结构代替原来通用的卷积神经网络(CNN)或循环神经网络(RNN)结构的生成器,同时使用强化学习算法actor-critic改进模型训练方法的一种模型,并且在特定的文本数据集上与其他模型进行了对比试验,具体工作如下:(1)提出了一种结合transformer架构的生成对抗网络模型,主要是使用transformer架构替代传统的卷积神经网络或者循环神经网络作为生成对抗网络的生成器。先把文本用词嵌入的方法进行预处理,同时为了弥补模型本身对序列位置信息的处理能力,再与序列的位置嵌入进行结合,作为网络的输入。经过多头注意力层及位置完全连接的前馈网络层,和层标准化等一系列处理,输出文本序列的概率。(2)提出了利用强化学习中的演员-评论家(actor-critic)算法改进生成对抗网络的训练策略,主要方法是用鉴别器所估计的概率的对数值当作强化学习中的回馈的奖励值(reward),同时把生成器选择当前需要输出的词的过程当作强化学习中的动作(action),把直到该时刻已经生成的序列当作强化学习中的状态(state)。(3)选择Penn Treebank数据集作为本文的实验数据,通过与seq2seq以及seqGAN这两个文本生成模型进行对比实验,以困惑度(perplexity)和bleu评分作为对句子质量的评估指标,以生成的句子中独有的2-gram、3-gram和4—gram的百分比作为句子中内容多样性的衡量。结果显示在这三个指标上,本文所提出的模型相对于对比模型均有所提高。从而验证了这个模型在文本生成中的有效性。
其他文献
桥梁裂缝检测一直是桥梁养护的重中之重,而当前普遍使用的还是较为传统的通过登高车、桥检车、脚手架等途径人为肉眼观测和接触性测量,因此对公路铁路桥梁更科学更便利的检测和养护研究就变得日益紧迫。随着计算机技术和CMOS成像技术的飞速发展,机器学习在视觉图像领域应用更加广泛,随着深度学习理论的提出,图像分割、图像分类、目标检测等成为了当前机器学习算法研究领域的一大热点。本文将图像分割技术与桥梁混凝土裂缝检
改革开放以来,我国制造业出口规模迅猛扩大,年均增长率高达15.12%,超过了出口贸易总额的年均增长速度。伴随着我国创新发展战略的实施和中国制造2025的出台,知识产权保护的重要性日渐突出。加强知识产权保护作为新时期的重大举措,对提高我国经济竞争力具有重要的激励作用。在此背景下,本文以探究知识产权保护与我国制造业出口的关系为研究主题,从理论和实证两个方面探讨知识产权保护对我国制造业出口的影响及传导机
目的:先前的研究表明,肌肉的功能状态通过直接或间接途径对大脑功能发挥着重要的调节作用。全身的肌肉功能状态可以通过肌肉力量这个指标来反映,而握力是目前最广泛被推荐的肌肉力量测评方法之一。据我们所知,很少有流行病学研究直接评价握力与抑郁症状之间的关联。因此,本研究拟在一般成年人群中,评估握力是否与抑郁症状间存在关联。方法:本研究是天津市慢性低度炎症与健康(Tianjin Chronic Low-gra
本文围绕低能耗亚硫酸氢镁预处理(Magnesium bisulfite pretreatment,MBSP)麦草制备燃料乙醇工艺展开研究,对影响预处理能耗的关键因素进行了探讨,研究了亚硫酸氢镁预处理液
二阶锥互补问题(SOCCP)作为一类具有普遍意义的均衡优化问题,近年来备受关注.学者们将欧几里得若当代数与谱分解作为工具,使得二阶锥互补问题的研究取得重大进展.目前,有关确
本文主要研究半模Iizuka同余下的一些基本性质与应用,研究了Iizuka同余下商半模的性质和三个基本同构定理;半模Iizuka同余下短伪正合列基本性质及其应用.全文一共分成四个章
在坚持发展新时代“枫桥经验”、强化基层社会治理、深入推进社会治安防控体系建设的社会大背景下,基层社区警务工作,作为维护基层社会治安秩序、发挥基层治安防控作用、预防和打击违法犯罪活动、深入推进基层社会治理、实现党群关系以及警民关系进一步密切融合、化解基层矛盾纠纷促进平安社区、平安社会建设的重要警务模式,在当今社会发挥越来越重要的作用。而基层社区网格化治理的试行与推进,坚持以人为本、服务为先的原则,坚
【关键词】党史学习教育 常态化 制度化  【中图分类号】D23 【文献标识码】A高度重视党史学习教育是中国共产党的优良传统  重视党史学习教育是我们党的优良传统。习近平总书记指出:“历史是最好的教科书。学习党史、国史,是坚持和发展中国特色社会主义、把党和国家各项事业继续推向前进的必修课。”建党百年来,中国共产党始终重视对自身历史的学习,并在总结历史经验中推进党的事业不断前进。  中国共产党成立初期
Coxeter群在代数,几何,组合学和其它数学领域都有重要应用。在很多地方都用了代数和几何观点来阐述Coxeter群理论。这篇文章的主要目的是研究XY
这篇学位论文研究的是局部ample半群代数,证明了≤ -有限的局部ample半群代数都有一个形式矩阵表示。特别地,有限局部ample半群代数有个一般的三角矩阵表示。作为它应用的推