面向互联网新闻的摘要自动生成方法研究与实现

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:gl5458
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能化社会的发展,人们在日常生活中接触各类新闻的方式也已经逐渐从报纸、杂志等传统媒介转变为各种的智能终端媒介,其中智能手机上的各种应用软件便是人们赖以获取信息的重要工具之一。然而对于需要获取特定领域新闻信息的人而言,只有一部分互联网新闻内容符合他们的需求。通过新闻的摘要可以帮助人们实现快速筛选新闻内容的目的,以降低人们获取新闻时的时间成本。新闻内容文本的准确性又会对摘要的质量产生直接影响。本文在基于现有的理论对该问题进行了扩展和延伸探究。所做的工作有以下几点:第一,深入研究了中文文本的校对技术,并将其融合应用于文本摘要生成的预处理过程中。综合研究了字词错误和语义错误的文本校对技术,运用Spell GCN拼写检查方法发现中文文本的字词错误,从大量训练语料中提取多项特征,研究了支持向量机(SVM)分类器与Spell GCN模型融合技术。并结合Uni LM模型以校正中文文本的语义错误,在提取句子语义基础上,通过文本生成的方式重构句子。实验验证了中文文本校对方法的有效性。第二,研究了深度学习模型在互联网新闻摘要自动生成中的应用。设计了基于N-gram模型和语义向量的过滤方法,采用束搜索算法对输出进行扩展已产生候选集,并根据所设计的过滤算法从候选集中选择最佳候选作为输出。实验结果表明了改进策略对模型结果的性能有明显的提升。第三,设计并实现了面向互联网新闻的摘要自动生成系统。整个系统由客户端和服务端构成,其中客户端为搭载在Android智能手机上的应用程序,实现对用户所输入的新闻内容生成对应摘要的功能。服务器端则是部署在服务机上的神经网络模型和相应的功能接口。本文给出了所采用到的各个算法过程和系统实现的关键部分,并通过实验验证了算法的有效性和系统的可用性。
其他文献
在市场竞争及政策支持下,近年来上市公司并购重组持续升温,这在促进我国企业改制、推动产业结构调整等方面发挥着积极的作用。与此同时,“高估值、高溢价、高业绩承诺”的“三高”并购活动逐渐增加,商誉泡沫与商誉减值风险逐渐累积。2019年1月底,数百家上市公司突发“商誉暴雷”,计提巨额商誉减值成为巨亏重灾区,引发了投资者及监管部门的关注。因此,研究上市公司巨额商誉减值的动因及经济后果具有较强的现实意义。本文
伴随着我国软实力的不断提高,现代的民族声乐也被更多的人所关注,民族声乐学习的参与者的队伍也在不断的壮大。评剧作为作为中国传统的剧种,其中很多技巧都被运用在民族声乐演唱中。因此本文以研究评剧旦角唱腔在当代民族声乐演唱中的运用为切入点,系统的梳理和分析了评剧唱腔元素在民族声乐中的运用,希望通过研究可以进一步提升自己对民族声乐的理解和演唱方面的技能。本文研究主要分为四个部分:第一部分绪论,对研究的背景、
深度学习指静脉识别技术中采用分类器有明显的缺点,如采用线性层进行分类时,无法对未训练过的类别进行识别。同时要实现新类别注册必须将其加入训练类别中对线性层参数重新学习,也就是新类别注册需要后台支持,并且所有训练数据需要一直保存,这将占用极大存储空间。身份识别特点是类别特别多,如要实现全中国人身份识别,网络线性层的参数量是13亿的千倍,计算机资源可能无法满足训练测试。本文提出了一个更符合实际运用需求的
中国脱贫攻坚战取得全面胜利,离不开各级财政对贫困地区的资金支持,扶贫整合资金和项目制资金在扶贫工作实践中贡献力量。2021年是“十四五”时期的开局之年,也是两个百年目标交汇与转换之年,脱贫攻坚与乡村振兴的衔接等成为新重点。然而,项目制资金和整合资金两种使用模式在资金的规模、批准权限、使用范围、受益人群、拨付目的、使用效率等方面均不尽相同。深入理解两种项目资金使用模式在基层治理中的特征与适用条件,明
探究非均质材料(如复合材料、多孔介质)微观结构和其宏观性能的关联具有重要的理论意义和应用价值,因此一直是材料、力学、物理等领域的热点研究问题。压痕实验作为一种新兴实验方法,在表征非均质材料多尺度力学特性方面具有特殊的优势。本文就非均质材料压痕实验中的几个力学问题进行了探索性研究。 首先,考虑到单一压痕实验可以跨越几个空间尺度,本文通过建立基于有限元和边界元方法的微力学模型模拟压痕实验,系统研
岗位匹配是人力资源的一个核心问题,由于岗位不匹配导致的人才流失已经成为企业人力资源开发与管理的危机之一。岗位不匹配是由客观因素和主观因素所造成的,但主观因素导致的岗位不匹配现象却一直很少受到重视,尤其是领导与员工对同一工作岗位的主观认知和看法。通过减少岗位匹配的认知差异,从而提高员工与岗位匹配程度,是企业解决此类问题最经济有效的办法之一。因而,由认知差异所导致的岗位不匹配现象,应当成为企业管理者未
在卫星导航领域,GPS的概念逐渐为GNSS所取代。相对于单一的GPS,更多的卫星星座将使GNSS接收机能够获得更精确的位置、速度和时间(PVT)信息。一方面,天上更多的可用卫星使得接收机可以通过选择合适的定位星得到更好的精度因子(Dilution Of Precision, DOP);另一方面,一些新的GNSS民用信号使用了BOC调制,可以提供比传统的BPSK调制信号更好的码跟踪精度、更好的抗多径
回旋管振荡管作为重要的大功率毫米波波源,在工业加热、雷达、定向能武器等领域有着广泛的应用需求,是当前国内外电真空器件研究的热点之一。准光模式变换器是回旋振荡管的核心部件,它将参与注波互作用的高阶波导模式转换成易于直接传输与辐射的准高斯模式,同时实现了有效的注波分离,为降压收集级的引入提供了技术基础。因此,研制能够模拟回旋管工作模式的激励器是完成准光模式变换器性能定量测试的必要前提。然而这类高阶波导
当前,微观交通仿真存在一些较为普遍的问题。一是当前的微观交通仿真系统中采用的车辆换道模型仍较为简单,无法体现出城市交通流的主要特征;二是当前的仿真系统采用的车辆换道模型缺少对安全驾驶行为的考虑,仿真过程中易发生车辆碰撞的现象;三是当前的仿真系统采用的车辆换道模型未明显区分临近交叉口的路段与普通的路段之间的换道规则,导致仿真的真实性较为缺乏。故本论文以车辆换道模型为核心,对混合交通流下的车辆安全换道
目前,针对游戏进行逆向分析并开发外挂程序进行攻击和检测非法行为已成为游戏安全领域的重点问题。其中攻击需要基于数据,而针对数据的分析存在明文call难以寻找的问题;检测则需要从不同的角度和出发点进行考量,而针对修改PE输入表注入DLL和外挂运行时恶意行为方面的检测还存在不足。据此,本文研究基于逆向工程的攻击与检测算法,设计并实现一套可用于网络游戏的攻击与检测软件系统,主要贡献如下:(1)提出逆向分析