用户驱动的特定领域自动文摘系统设计与实现

来源 :东北师范大学 | 被引量 : 1次 | 上传用户:rfy68213919
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代科技的高速发展,报纸、书籍、科技文献等以文字为载体的信息大量涌现。尤其是在国际互联网络高速发展的带动下,每天都会有不断涌现的海量信息。为了能从这些海量的信息中快速、准确的找到用户需要的信息,文章的自动文摘成为越来越被关注的研究课题。在研究比较了相关的自动文摘方法后,我们采用基于统计的自动文摘方法实现了一个用户驱动的自动文摘原型系统,对其性能进行了测试。指代是现实生活中比较常见的语法现象,在文章处理过程中也常常因指代问题导致文摘生成结果不准确。针对自动文摘因指代问题产生的问题,本文结合目前的研究状态,对篇章消解算法进行了简介,并提出一种类似于篇章消解算法思想的特定领域的自动文摘系统的实现方法。通过分析原始文本中存在的指代关系,重新计算词频和句子的重要度,来获得新的文摘结果。本文详述了用户驱动的特定领域自动文摘系统实现方法,并通过实验验证了类似篇章消解算法的应用对于文摘结果的改善。为了验证所提出方法的可行性和有效性,本文采用内部评价方法对开发的文摘系统进行评估。从论文库中抽取政治学科的100篇论文,获取文摘,进行评测,可以看出我们提出的类似于篇章消解算法的方法对特定领域自动文摘系统的性能有所改善。
其他文献
电子邮件成为网络病毒传播的重要途径,隐藏在电子邮件中的计算机病毒常常随着邮件一起传输,在一定条件下激活,进行破坏和传播,轻则占用资源、破坏计算机系统部分功能,重则导
本文主要对无线传感器网络分簇算法,数据融合和恢复算法进行了研究。首先对无线传感器的网络概念内容进行介绍,讲解了重要的设计目标、挑战和特点,介绍应用领域和研究的热点
移动自组网(mobile ad-hoc networks,MANETs)是由移动节点组成的一个多跳临时性自治系统,它不依赖于预设的基础设施并能够快速组网。由于移动自组网本身的特殊性,如何设计一
步态识别是计算机视觉研究领域的重要课题之一,因其具有远距离身份识别的特点,成为近年来计算机视觉领域中备受关注的前沿方向。本文主要对人体运动的跟踪、运动人体轮廓提取
经典智能规划要求智能体对规划世界的知识是完全的,规划过程中动作的效果是确定的,但现实世界中得到的信息往往是不完全、不确定的。为了满足智能规划技术应用于实践中的目的
随着无线通信技术的发展,移动计算的应用越来越广泛。人们可以通过无线网络随时随地访问信息。然而,不同于传统的分布式计算环境,移动计算环境有其鲜明的特点:移动性、断接性
随着网络安全的不断深入,传统的网络安全技术暴露出很多问题,入侵检测技术作为一种积极主动的安全防御技术,越来越受到大家的重视。但是,入侵检测技术在发展中也存在很多问题
随着我国工业的不断发展,工厂废气产生的大气污染日益严重。污染扩散可视化将有助于大气污染的科学管理,为环保部门提供直观、科学的分析手段。然而,建立污染扩散可视化场景
近几十年来,随着计算机硬件和软件的迅速发展,尤其是Internet技术的快速进步,人们收集到的数据以令人吃惊的速度日益增加,数据挖掘已经成为研究的热点;尤其是对于其中的分类
随着网络和信息化技术的发展,越来越多的行业和部门开始借助于网络进行辅助管理。而高校作为社会发展的主要推动力之一,更要走在时代前列,推动教学网站的网络化建设,而教学资源库