【摘 要】
:
随着社会的进步和互联网技术的发展,网络信息量的频繁剧增,当今社会面临着信息大爆炸。每天都有大量信息以电子文档的形式出现在人们面前。如何在海量信息中搜寻所需要的信息
论文部分内容阅读
随着社会的进步和互联网技术的发展,网络信息量的频繁剧增,当今社会面临着信息大爆炸。每天都有大量信息以电子文档的形式出现在人们面前。如何在海量信息中搜寻所需要的信息、获取信息的主旨,如何快速阅读每天涌现出来的新信息,已经是一个非常急迫的问题。实际上,人们不可能通过阅读所有的电子资料来获得所需要的信息,传统人工处理信息的手段已经远远不足,迫切需要信息压缩精选工具来对大量信息进行提炼、浓缩,而自动摘要技术正是解决这一难题的有力工具之一。自动摘要技术是自然语言处理领域的一项重要的研究内容,其研究目的是探索人们从自然语言篇章中获取信息,提炼信息的思维机制,并在此基础上开发出能够自动编写文档摘要的系统,从而可以提高信息检索、传播的效率。文摘是准确全面反映某一文章中心内容的简洁连贯的短文,与索引相比更能满足信息获取的要求。虽然我国对文摘技术的研究目前还在初级阶段,但此技术所具有的重要作用不可低估,将会在未来的信息处理领域得到广泛的应用。目前已有的自动摘要方法主要分为四种主要的自动摘要方法:基于理解的自动摘要,自动摘录,信息抽取和基于结构的自动文摘。本论文基于目前的研究现状下,运用处理自然语言的一些方法,结合现在比较流行的编程语言编写了一个系统。系统用到了分词、权值计算等方面的相关算法。考虑到实际使用的速度和质量,本文给出了关键词和关键句选取的权值公式,采用了原文摘录的方法提取文摘句。此方法实现简单,适用于非限领域。
其他文献
随着信息技术的飞速发展,许多领域产生的数据是在时间维度上严格有序、在数值上不断变化的无限的数据序列,由此产生数据流模型。数据流频繁项集挖掘作为数据流挖掘的一个新兴
近几年来,随着计算机网络及分布式系统的大量应用,网络入侵的方式层出不穷,计算机网络的安全问题越来越成为人们广泛关注的焦点。传统的安全技术,如入侵防御和入侵检测技术无
在玻璃的生产线上,不允许玻璃上出现大量的明显的缺陷,否则会影响其质量。因此,开发一套低成本的玻璃检测系统便有极大的科研价值。本文所做的工作就是为一厂家开发检测系统
一般地,在进行对象建模时通常有两种模式:基于统计的方法和基于结构的方法。在统计模式识别中,研究对象常表示为特征向量。特征向量的表示形式具有数学运算上的优势,但另一方
网络的快速发展,网络设备的增加和拓扑结构的复杂,使网络安全问题变得日益突出。网络安全管理技术需要进一步的发展,网络安全管理平台就是在这种情况下出现的一种新型的网络
自动人脸识别是当前模式识别领域中的一个极具挑战性的研究课题,因其在法律、商业、军事等领域具有广泛的应用前景而日渐受到各国政府以及科研单位的广泛关注和高度重视。如
随着XML相关标准的推广与应用,Web上出现了大量的XML文档。为了有效的管理,有必要将XML文档存储到数据库中。存储方案已成为XML数据管理领域研究的一个重要课题。纯XML数据库充
在多Agent系统中,单个Agent的功能非常有限,Agent之间需要通过频繁的信息交换和密切的协同工作以完成复杂功能,通信是Agent需要具备的基本功能。因此通信安全就成为多Agent系统
人类社会正迈向一个高度信息化、数字化的时代。在这种形势下,大量的信息被数字化并由信息系统统一维护和管理。随着信息系统的不断完善,信息系统管理着越来越多重要的数据,
钉螺的分布直接影响着血吸虫病的分布,有效控制钉螺也是目前最有效控制和预防血吸病的措施,而钉螺的分布与其孽生地环境的自然因素密切相关,并具有一定的空间特征,因此研究钉