【摘 要】
:
大数据时代的到来,人们对网络的依赖程度与日递增。由于网络信息十分繁杂,人们需要从大量信息中提取出关键信息。网页信息篇幅较长,且关键信息分布不均,完整浏览网页内容耗时严重。在检测流程中,研究人员查找检测数据,需要翻阅大量文献,检测标准均匀分布在各个章节中,需要翻阅多篇才能抽取汇总。目前模型较多处理新闻类等短文本数据集,该类总结语句比较明显。对于在原文中主题信息分布均匀,且篇幅较长的文本内容,获取的摘
论文部分内容阅读
大数据时代的到来,人们对网络的依赖程度与日递增。由于网络信息十分繁杂,人们需要从大量信息中提取出关键信息。网页信息篇幅较长,且关键信息分布不均,完整浏览网页内容耗时严重。在检测流程中,研究人员查找检测数据,需要翻阅大量文献,检测标准均匀分布在各个章节中,需要翻阅多篇才能抽取汇总。目前模型较多处理新闻类等短文本数据集,该类总结语句比较明显。对于在原文中主题信息分布均匀,且篇幅较长的文本内容,获取的摘要信息常常有以下问题:较难提取位置靠后的关键信息,生成信息与原文不符,语句中重复单词较多,未登录词出现频率较高。本论文的目的是提高从均匀分布的文本信息中生成的摘要质量,并开发原型系统。我们提出了一种新的结合生成式和抽取式的算法模型,对摘要生成算法进行改进,我们的主要创新点为:1.分别提出基于预训练模型在抽取式和生成式两种算法上的改进,使得其对全局信息记忆增强。2.结合两种算法上的优势,提出了一种新的联合模型,使得其对分布均匀的文章信息,生成的摘要更符合原文题意,并且重复率降低。为了让模型更好处理分布较为均匀的原文信息,本文提出了新的抽取式算法模型和生成式算法模型,以及抽取式和生成式两种算法联合的摘要生成模型,在多个数据集上进行了对比试验,并且构建了小型分布均匀的私有数据集。在多项对比实验中,评价指标最高提升了1.8个百分点,证明了方法的有效性,并且搭建摘要自动生成原型系统进行结果展示。
其他文献
我国海洋资源丰富,开发潜力巨大,随着近年“海洋强国战略”的实施,我国海洋结构基础设施建设不断增加,浮箱结构作为一种新型海洋水工结构,被广泛地应用于大型采油平台、水上光伏电站、水上牧场的围箱、浮式码头、浮式栈桥等工程中,但由于海洋工作环境恶劣,现有浮箱结构耐腐蚀性能下降严重、使用寿命缩短、维护成本升高,无法满足浮箱结构的长期使用要求,因此制备一种新型的高性能、耐腐蚀的结构材料来研发浮箱具有重要的实际
导电纤维膜兼具柔软性和导电性的优点,已被研究用于分子电路、电容器、气体传感器、滤芯材料及安全防护服装等,在电子、生物、环境和纺织等领域应用广泛,并具有一定的应用潜力。聚苯胺是一种集众多优点于一体的导电聚合物,具有导电性能良好,稳定性高,合成简单以及制备成本低等优点,这对制备导电纤维膜具有重要的理论及现实意义。聚苯胺和石墨烯进行复合,会具有增效作用,不仅会提高导电性能,也会弥补单一材料的不足之处。因
五轴数控加工中心以其高精度、高自由度、自动化程度高等特点,成为叶轮、叶片、螺旋桨等复杂曲面零件唯一的加工方式,广泛应用于航空航天、船舶制造、汽车制造、模具制造等行
随着网络通信技术的飞速发展,通过互联网对机器人进行远程控制已经成为一个重要的研究方向,网络遥操作技术的应用也越来越广泛。遥操作机器人极大地延伸了控制距离,能够代替人类在超远距离、环境恶劣情况下完成作业,在远程医疗、太空探索、危险搜救等方面显示了其优越性。然而在远程控制中,网络存在着随机时延、数据包丢失等问题,会造成机器人运行精度降低,影响系统稳定性,所以消除时延对遥操作机器人网络控制系统的影响具有
嵌段共聚物纳米粒子由于其多样的形态结构在诸多领域有着广阔的应用前景,一直以来是高分子研究的热点。目前,研究人员已经可以通过多种方法合成各种形态的纳米组装体,而嵌段共聚物纳米粒子的性质和实际应用依然需要更多关注。本论文共包括三部分内容,一是通过点击化学与种子RAFT分散聚合原位合成了具备多相微区的三嵌段杂臂星型聚合物纳米粒子,并探究星型或是线性的聚合物结构对聚合物纳米粒子界面性能方面的影响;二是由R
作为传统民俗生活中重要的文化符号,烟花爆竹始终是大众消费品中的大宗商品,中国也一向为烟花爆竹的生产、消费、出口大国。晚清以来,随着全球化贸易的日益紧密,加之港澳贸易
我国物权规范将动产担保物权划分为动产抵押权、动产质权和权利质权。随着社会经济发展,动产类型不断丰富,作为中小企业重要融资途径的新型担保方式在实践中逐渐产生,但却囿于严格的物权法定主义而难以在现行法中获得合理定位。泾渭分明的权利类型体系容易导致法律规范间的繁冗与冲突,建立在多元动产担保物权制度下的分散登记制也人为增加了登记成本,无益于交易效率提高。在上述制度缺陷的共同作用下,我国动产担保物权制度的价
碳纳米纤维是一种新型纳米纤维,由于前躯体多,性能优异而被广泛关注。聚丙烯腈(PAN)是一种性能较好的碳纳米纤维前驱体材料,而纳米纤维素(CNF)则是一种新型无机纳米增强材料,将两者结合纺丝是增强碳纳米纤维的一个新思路。本文采用静电纺制备聚丙烯腈(PAN)/纳米纤维素(CNF)纳米纤维膜,并通过碳化的方法制备出的PAN/CNF基碳纳米纤维,从而拓展了PAN和CNF的应用领域。本论文的研究内容主要包括
随着深度学习的高速发展,越来越多的领域将神经网络作为自动化工具应用在现实场景中,比如图像分类器、语音识别系统、文本翻译等,在深度学习技术的支持下,很多任务的处理变得更加快速且精确。然而,在现实应用场景下,深度学习的安全性却始终没有得到保证。在数据准备、网络训练、模型部署等各个环节,深度学习的安全都可能会受到威胁,导致系统功能故障或数据发生泄露,引发严重的人身或财产安全问题。在图像领域,对抗样本就是
高熵合金一般由五种或五种以上的元素组成,多主元合金化使得该类合金具有原子迟滞扩散,高的晶格畸变以及组织结构单一等特征。Al0.3Co Fe Ni高熵合金是一种单相FCC晶体结构的