基于聚类与深度学习的自监督文本摘要方法

来源 :通讯世界 | 被引量 : 0次 | 上传用户:sandro
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对文本聚类过程中无法对多义词有效表征而导致的聚类效果低,引入Bert预训练语言模型增强句向量的语义表示,将生成的句向量利用K-Means算法进行聚类,选择最接近质心的句子作为此段文本的初始摘要;针对基于深度学习的生成式方法标签语料难获取,以及抽取式摘要可读性低的问题,将初始摘要作为语料标签,引入文本生成能力更强的GPT-2语言模型进行训练,最后得到最终摘要。实验结果表明,此自监督式摘要方法生成的摘要文本质量有所改善,一定程度上缓解了摘要标签获取困难的问题。
其他文献
目前我国社会经济正处于高速发展时期,各行各业也随之取得了不错的成绩,特别是计算机信息行业,成为新时期发展势头最迅猛的行业,在计算机技术发展的推动下,三维动画技术进步
工业互联网作为新一代信息技术与制造业深度融合的产物,正在深刻变革着传统工业的创新、生产、管理和服务方式,催生出许多新技术、新模式、新业态、新产业,日益成为新工业革
随着对脑卒中早期治疗技术水平的提高,特别是急性期的及时处理能力的提高,患者的存活率也有明显的提高.全国每年脑卒中发病人数超过150万人,致残率约86.5%[1],严重影响患者的
现阶段对传媒经营问题的研究应置于集团化背景下.中国传媒集团经营发展面临的重大问题主要有:传媒集团经营体制与运作机制的重新建构;资源的重新配置与优化整合;产品结构与产
马克思主义产生在西方资本主义国家,它能传播到中国,并在中国枝繁叶茂,心然有其适宜的文化切合点。这个切合点就是中国传统文化的精华,即中国传统文化中的大同思想、崇实思想、民
本文对在中国移动云南公司的客户体验管理体系进行分析,以“端到端”流程构建为核心,嵌入各个生产环节的不同指标和督办闭环为抓手,提出通过智能化IT手段搭建的“端到端”智
华东医院成立于1951年,50年来,在上海市委、市政府和市卫生局的领导下。经过新老“华东人”的不断奋发努力,使医院从建院初期单纯的干部医疗保健医院,发展成为一所设施先进、专科
伴随着我国经济的持续增长,航空工业也得到了快速发展。近年来,随着民航事故频发,事故征兆增多,各级民航管理部门对航空安全监管力度也在不断加大。无线电技术在各行业中的广
广播电视作为人们日常生活中的重要娱乐手段,在满足人们精神追求方面起积极作用,丰富了人们的日常生活。在广播电视发展过程中,广播电视工程技术起至关重要的作用,是广播电视
本文从文化计算的角度对虚拟现实、增强现实和混合现实在文化遗产上的应用进行了系统的梳理,重点讨论三种技术手段在跟踪、设备、系统等方面的异同,探讨虚拟现实、增强现实和