中文自动文摘及评价方法的研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:wangyc726
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的高速发展,网上的信息急剧增长。如何快速在这海量信息中搜寻所需要的信息、获取有用的主旨,已经是一个迫在眉睫的问题。文摘作为文献内容的缩影,其简洁性、准确性和清晰性使其成为挖掘有用信息的有效方式。传统手工编制的文摘,生产方式效率低,难以满足快速信息检索的需要。而利用计算机和人工智能技术实现的自动文摘,易于信息的检索和再处理,已成为时代的要求。本文就对中文自动文摘及评价方法进行了系统的研究,具体研究内容包括以下三个方面:1、设计了一种新的基于骨架依存的句子相似度计算方法在自然语言处理领域,句子相似度计算是一项应用非常广泛的技术,并且发挥着重要的作用。本文在综合分析现有句子相似度计算方法的基础上,提出了一种新的基于骨架依存的相似度计算方法。该方法是在句法分析的基础上进行词义的相似度比较,并且考虑了否定意义副词对句子相似度的影响。它能够更准确的反映句子之间的语义相似度关系,是一种适合文摘的句子相似度计算方法。2、提出基于多特征融合的中文自动文摘方法并实现自动文摘系统自动文摘经历了五十多年的发展,已存在着许多种不同的方法,但其效果都不尽如人意。所以,本文在分析自动文摘现有方法的基础上,提出了基于多特征融合的中文自动文摘。它是将统计、语义、结构信息用特征来表示,并采用机器学习的方法对这些特征进行训练得到摘要器,然后通过可读性加工提高连贯性和消除冗余信息,生成了质量较好的摘要。该方法能克服摘录式文摘缺乏语义和结构分析的缺陷,又能弥补理解式文摘领域受限的遗憾。3、提出了基于文本相似度的自动文摘评价方法系统评价是自动文摘系统中一个非常重要的环节。一方面,系统评价可以验证系统的有效性、可用性和可理解性;另一方面,系统评价产生的结果可以反馈到不同处理阶段,这一过程可以促进系统性能的提高。本文总结了内部评价方法的缺陷,提出了一种基于文本相似度的自动文摘评价方法。该方法是把机器摘要与标准文摘(或专家摘要)进行文本相似度比较来获得系统的性能值。这三方面的研究内容是一个完整的体系,基于多特征融合的自动文摘方法是核心,基于文本相似度的自动文摘评价是验证,而相似度算法是两者的重要内容。
其他文献
目的:探索补肾,健脾,活血三类中药复方对免疫因子引起的下丘脑单胺类神经递质的不同影响。方法:用侧脑室注射白细胞介素-1β(IL-1β),观测大鼠下丘脑匀浆液中单胺类神经递质的变化,建立一个
沈阳联通公司隶属于中国联通集团公司,作为中国三大电信运营商之一,为客户提供固定电话、宽带、移动、信息服务、中继线等全业务。面对日益竞争的市场环境,在做好市场前端营
目的:为观察冠心舒通胶囊对犬实验性心肌缺血、心肌梗塞和血液流变学的影响。方法:采用健康犬造成急性心肌缺血模型,观察了蒙药冠心舒通胶囊经十二指肠给药后对心肌缺血、心
中国是一个农业大国,在现代化和农业产业化过程中,农业产业化经营项目作为农业经济发展的原发点,已经在中国的大地上强力推进蓬勃发展。与其他项目相比较,农业项目最大的特点
<正>8月24日,早些时间的传言终于"靴子落地",饿了么CEO张旭豪正式宣布收购百度外卖。百度外卖成为饿了么的全资子公司,暂时保持独立运营,高层及公司架构不变,百度外卖将与饿
期刊
企业的薪酬制度是为实现企业的战略而服务的,在不同的企业发展阶段有不同的战略,对此应采取不同的薪酬战略以使得薪酬制度适合企业的发展特点,兼具内外部的公平性并具有可操
汽车工业在向轻量节能减排的方向发展,迄今,电子技术几乎深入到汽车所有的系统中。毫无疑问,汽车电子化程度的高低已经成为衡量汽车先进技术的重要标志。安森美半导体(ONSemicond
随着供电企业的发展,供电企业的档案管理逐步规范和完善,具体表现在构建了系统的档案管理体制,也颁布了企业档案管理标准,工作中并严格按照档案管理制度标准贯彻执行。拥有了较为
本文对传统农业基础理论,从七个方面进行了反思,并指出其局限性,认为它是产品经济,计划经济体制的产物,同时,从“农业是粮食等基本生活必需品的来源”这一认识,论证了工业社会不能改
军令上只写着:攻下城池!诸葛亮从来不问刘备,为什么我们的箭那么少?关羽从来不问刘备,为什么我们的士兵那么少?张飞从来不问刘备,兵临城下我该怎么办?于是有了草船借箭、有了过五关