基于深度学习的散文诗自动生成方法

来源 :杭州师范大学 | 被引量 : 1次 | 上传用户:kuang25748
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
诗歌是一种有着特殊魅力的文学体裁,是一种人类文明发展的象征。在当前时代下,使用计算机对散文诗进行模拟生成成为自然语言生成领域的一个挑战。本文通过建立散文诗语料库,基于深度学习模型进行散文诗创作,实现散文诗的计算机辅助创作。它可以为广大的散文诗歌文学爱好者提供很大便利,同时也有助汉语言的传播与宣扬。本文针对中文散文诗的创作,对计算机自动生成散文诗进行了研究,首先分类和总结了诗句自动生成领域的研究成果,对深度学习的相关基本概念和具体结构和训练方法进行了讨论。在此基础上,提出了基于主题模型和深度学习相结合的诗歌生成方法。通过对散文诗逐句分割以及对每个诗句进行分词处理后,在已有给定主题的语料文档上,针对分词结果采用基于主题模型特征进行同一主题聚类。该方法依赖于词组短语自动索引的统计信息,有效地解决散文诗生成过程中同义词、多义词的词组短语聚类问题,建立了较为完备的知识语料库。该方法在散文诗的自动生成过程中,通过改进卷积神经网络的特征提取层得到上下文结构模型。这种方法不同于传统朴素贝叶斯的概率模型,实现了基于n-gram的计算,通过顺序合并相邻结果向量,得到诗句文本的连续向量表示,较好地获取了长句子的特征信息。然后将上下文结构模型输出向量作为生成模型的输入,利用权重化LSTM模型进行输入并且循环计算得到句子输出,实现具有良好上下文关联的散文诗自动生成方法。最后,采用BLEU自动评测和人工评测两种互补方式设计实验以及进行图灵测试,建立起较为标准的评价系统。实验结果表明,该方法建立的模型和设计的系统较好地实现了散文诗的计算机自动生成,为今后进一步研究提供了理论和实验基础。
其他文献
本文运用马克思主义的立场、观点和方法,研究分析了历史上各种技术观的演变及利弊,指出这些技术观虽然各自适应了不同发展观的需求,但割裂了技术系统与经济、自然、社会系统的有
0引言在高温热辐射率涂层材料研究方面,最引人注目和受重视的是陶瓷红外辐射材料,并已取得了许多成果。可以说,稳定的尖晶石型结构陶瓷红外辐射材料已成为目前研究的热点。将其
胶原蛋白是细胞外基质中含量最丰富的蛋白质,也是生物材料领域最常用的天然高分子之一。设计胶原基质将对理解基质生物学和构建安全医学上有用的生物材料的能力有着广泛影响。由于天然胶原蛋白难以修饰,且会产生致病性和免疫等方面的副作用,使其在组织再生中的应用受到限制。化学合成和细菌表达的类胶原多肽具有清洁、易修饰等优点。因此,近年来,它们已被用作胶原纳米材料的理想基底。但是从合理设计肽段到形成均匀纳米结构的仍
核心竞争力是企业在市场竞争中保持竞争优势的源泉,为企业带来持续不断的利润,本文结合建筑企业核心竞争力的内涵,提出建筑企业核心竞争力的提升的途径。
在我国社会主义市场经济发展中如何处理好公平与效率的关系问题,是一个十分重要的理论问题与现实问题。本文针对近年来经济生活中片面追求经济增长速度,忽视社会公平问题的倾向
建立循环经济评价指标体系以后,评价方法的选择非常重要。模糊综合评价方法适于对多层次、多指标的系统进行定量评价,能够提供较多的评价信息,是一种合适的区域循环经济发展水平
随着世界现代化进程的加快,中国面临着良好的机遇和严峻的挑战,走人才强国道路是使中国傲立于世界之林的关键。增强国民素质,发展基础教育,是党和国家长期以来坚持的政策和目
目前体育中考的话题已经成为人们关注的热点,而如何在满足学生体育兴趣的同时,促进其身心全面发展,培养自觉参与体育锻炼的意识习惯和能力,从而解决应试教育的现状,是学校、
农业废弃物综合利用有助于改善人居环境,促进农业绿色发展,是落实生态文明建设的重要途径。打响环境保卫战,北京市积极推动落实绿色发展方式和生活方式,建立农业废弃物全量利
通过1998年夏季(6-8月)天气图及部分资料的分析,对引起1998年夏季长江流域特大洪水的大到暴雨作了初步分析.结果表明:1998年夏季长江流域致洪暴雨的发生、发展是在一定环流形