【摘 要】
:
针对摘要模型中总结并解释长篇上下文信息存在的困难,提出一种基于细粒度可解释矩阵,先抽取再生成的摘要模型(fine-grained interpretable matrix,FGIM),提升长文本对显著度
【机 构】
:
北京理工大学计算机学院,中国移动通信研究院,北京市海量语言信息处理与云计算应用工程技术研究中心
【基金项目】
:
教育部–中国移动科研基金(MCM20170302)资助
论文部分内容阅读
针对摘要模型中总结并解释长篇上下文信息存在的困难,提出一种基于细粒度可解释矩阵,先抽取再生成的摘要模型(fine-grained interpretable matrix,FGIM),提升长文本对显著度、更新性和相关度的可解释抽取能力,引导系统自动生成摘要。该模型通过一个句对判别(pair-wise)抽取器对文章内容进行压缩,捕获文章中心度高的句子,将抽取后的文本与生成器相结合,实现摘要生成。在生成端通过可解释的掩码矩阵,控制生成摘要的内容属性,在编码器端分别使用多层Transformer和预训练语言模型
其他文献
针对当前生成式文本摘要模型在解码时对摘要整体语义信息利用不充分的问题,提出一种基于语义对齐的神经网络文本摘要方法。该方法以带注意力、Pointer机制和Coverage机制的Se
通过对煤岩标准中的基础标准、方法标准、产品标准的综合分析,系统地论述了从煤岩样品采取、制备、检测及宏观到微观的煤岩标准体系,探讨了煤岩标准应用中煤岩分析样品制备、
网络攻击是最重要的变电站安全问题之一,为了更好地识别易受攻击的变电站,首先需要对侦察活动进行建模。在此基础上研究相应的网络攻击和防御策略。利用马尔可夫决策过程建立
针对多轮会话中的Non-Sentential Utterances(NSUs)问题,结合当前在自然语言处理领域广泛使用的预训练语言模型,将Masked Language Model用于多轮会话NSUs的重写任务,提出Mas
分析了煤的高位发热量的计算原理,对ISO1928—2009、ASTMD5865—10a、GB/T213--2008中高位发热量的计算、硝酸形成热等问题进行了探讨,总结了在实际应用中不同情况的处理方法。