基于知网文本相似度的文摘自动评测方法研究

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:cenzijn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的发展,网页信息多样化和网页内容复杂化给大多数用户带来了不便,为了解决这一问题,很多研究者着手研究自动文摘技术,并且他们设计开发了很多文摘系统。然而自动文摘评测是一个非常复杂的问题,它和语言学领域、心理学领域和人工智能领域等多个领域有关。到目前为止,自动文摘评测技术还存在着很多困难,也没有形成统一的标准,这使自动文摘评测技术具有很大的研究价值,同时富有挑战性。在中文文摘评测领域中,因为没有统一标准的测试集和评测平台,从而严重地制约了中文文摘技术的进一步提高。因此,在这一领域要找到一种高效、准确的评测方法来对文摘系统进行性能评测,对其研究工作进行具体的指导。针对上述问题,本文为了更准确、更高效地进行文摘的自动评测,对现有的自动文摘评测方法进行了具体分析,指出了这些评测方法的缺点后,在向量空间模型方法的基础上提出了一种新的自动文摘评测方法。在向量空间模型中,该方法采用知网对词语的含义进行深入分析,在计算特征项权重时考虑词性在句子中充当角色的作用,并且对特征项权重计算公式进行了改进。本文实现了分词统计的程序,验证了要想分词有较好的效果就需要选择好的词典。针对本课题中提出的方法开发设计了基于词频的自动文摘系统和基于知网文本相似度的自动文摘评测系统,实现了提出的新方法。将本文提出的文摘评测系统分别和P/R方法、文本相似度评测系统作比较,实验结果表明,新方法的评测效果有了显著提高。
其他文献
随着集群规模的逐渐扩大和性能的日益提高,集群调度技术作为集群的关键技术也成为研究的难点和热点。粒子群优化算法(Particle Swarm Optimization, PSO)具有并行性、有效的全
随着现代工业的迅速发展,机械设备的规模越来越庞大,自动化程度越来越高,集成化管理方式也越来越普遍,一旦设备出现问题将会带来重大的事故和巨大的财产损失。传统的采用简单仪器和人工经验的方法己不能满足现代复杂设备的故障诊断。近年来,机械故障诊断技术在国内外受到高度的重视,在机械学、通信学、计算机学和人工智能等科学的基础上迅速发展成为一门新兴学科。利用智能系统对设备进行故障诊断,及时发现故障,以保障关键设
随着3D图形学以及计算机软硬件的发展,现在的游戏已经可以创造出非常优美的画面。在这种情况下,游戏中人工智能的好坏成为了决定一款游戏成功还是失败的重要因素。因此人工智能
随着计算机网络的发展,越来越多的人使用互联网办公、娱乐。在享受着互联网服务的同时,面临着的安全威胁也日益加剧。木马病毒、僵尸网络的崛起,降低了网民的网络使用体验。
近年来,增强现实中自然场景的重建已经成为计算机视觉领域中的一个研究热点。它的研究在虚拟现实、自然灾害预警、游戏动画、军事仿真等领域有着广泛的应用前景和重要的应用
无线传感器网络(Wireless Sensor Networks,WSNs)作为物联网技术的重要组成部分,已被广泛应用到各个领域中。然而由于传感器节点固有的特点,导致其通信、计算、存储、和电源
随着移动通信技术和计算机技术的飞速发展,地理信息系统(GIS)在通信行业的应用越来越广泛,目前在移动通信网络规划与优化方面,地理信息系统应用十分普及,不过在网络规划与优
当前,数据挖掘已广泛应用于金融、制造和医疗等领域。但随着知识库的信息量急剧增加,人类迫切需要一类工具能从数据量大、冗余多,且存在噪声数据干扰的知识库中提取潜在有价
多访问控制域间的安全互操作是实现信息资源跨域共享的主要技术手段,但各控制域内访问资源时所定义的策略存在各自的独特性,导致域间会产生较大的差异,由此给安全互操作带来
为了适应和解决地面交通快速发展所带来的各种交通问题,交通情况的综合分析即智能交通系统的研发被提到了重要的位置。远动车辆的检测及跟踪被作为智能交通管理系统(ITS—Int