基于堆叠BiLSTM的中文自动文本摘要研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:maxever888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,人们接触到的文本数据越来越多。摘要是人们解决阅读数量过大,但时间不足的一个好方法。自动文本摘要旨在用计算机代替人工,将长文本概括成简洁的摘要,减少人工成本,增加摘要的生成数量。现有的很多文本摘要技术还是基于抽取式,摘要生成简单,不能够完全表达文章含义。深度学习的进步,让自动文本摘要研究有了新的方向。目前,基于Seq2Seq框架的神经网络模型已经成为生成式文本摘要研究的基本框架。本文在此基础上,构建了多个生成式自动文本摘要模型,按照字典个数分为单字典自动文本摘要模型和多字典自动文本摘要模型,主要研究内容如下:1)本文基于堆叠BiLSTM构建了融合复制机制和覆盖机制的单字典自动文本模型。该模型采用堆叠BiLSTM进行信息抽取,提高模型理解语义的能力。模型融合复制机制和覆盖机制,增加文本摘要的连贯性和可读性,减少文本摘要的未登录词问题和词语重复问题。2)在单字典自动文本摘要模型研究的基础上,为简化模型结构,提高模型效率,本文基于堆叠BiLSTM构建了融合覆盖机制的多字典自动文本摘要模型。3)本文将集成学习加入实验。由于不同编码器理解语义不同,采用不同编码器进行模型训练,通过对多个模型进行集成,增加模型理解语义的多样性,提高实验预测结果的准确性和实验的泛化能力。论文采用ROUGE指标,在哈尔滨工业大学智能计算研究中心构建的大规模短文本中文摘要数据集LCSTS2.0上进行实验分析。实验结果证明,与融合复制机制和覆盖机制的单字典自动文本摘要模型相比,融合覆盖机制的多字典自动文本摘要模型能够提升10%的ROUGE指标,基于该模型进行模型集成可以提升5%左右的ROUGE指标。
其他文献
对制备的纳米级涂料的染色性能进行较为深入的研究 ,给出了应用工艺 ,尤其对无粘合剂体系直接用涂料浸染织物进行了研究 ,提高了传统涂料染色的色牢度 ,改善了涂料染色后织物
今天,是中国共产党的90岁生日。在全区各族人民隆重庆祝这一盛大节日的时候,我们谨向奋战在全区各条战线上的广大共产党员致以节日的问候l并向同志们致以崇高的敬意!
心肌肌钙蛋白T(cTnT)是近年来发现的一种高特异性、高灵敏度的反映心肌损伤的血清标志物,具有在血中出现时间早,持续时间长等特点.在急性心肌梗塞病人中有1/3的人症状常常不
目前,我国电视直销企业已进入经营的'谷底'.为了扭转这一不利局面,使电视直销企业再现辉煌,组建电视直销企业集团,实现连锁经营;实行买断经营,降低经营成本;通过差异
目的: 探讨培美他尼雾化吸入治疗毛细支气管炎的临床疗效.方法: 应用培美他尼雾化吸入治疗38例毛细支气管炎患儿与40例常规输液治疗患儿的疗效对比.结果: (1)培美他尼雾化吸
绿色、可持续和生态设计是21世纪建筑设计的主题,同样也是室内设计的主题。我国竹资源十分丰富,主要分布长江以南的省份,但我国的竹开发和应用尚处于起步阶段,其经济效益和社
针对当前深圳人才反映强烈的高房价问题,《关于促进人才优先发展的若干措施若干措施》在继续坚持和强调加大公共租赁住房、安居型商品房配租配售力度等现有政策外,还提出多方
目的:研究大鼠实验性牙周炎在发生发展过程中,糖尿病对其的发挥的作用及影响。方法:选取48只雄性SD大鼠采用在右上颌第一磨牙牙周拴丝的方法构建大鼠牙周炎模型。随机均分为2组
初级练习:1.(1)bin (2)lu (3)ke(4)mu2.略。3.拟人句:他们骑着浪花奔跑……撒下一片欢笑。比喻句:他们……应着那小鹿般欢腾的潮。4.略。