一种基于潜语义标引的全文检索系统的研究与实现

来源 :南开大学 | 被引量 : 0次 | 上传用户:csnzz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文在总结现有方法的基础上,讨论并简单实现了一个基于潜语义标引技术(LSI)的全文信息检索系统.该系统试图利用潜语义标引技术,从文档中词语的使用模式来发掘文档的潜在语义结构,在文档与查询向量组成的空间中计算它们之间的相关性,并根据初始查询结果选择一个相关反馈文档对查询进行扩充,以获得更好的性能.初步测试结果表明,该系统在一定程度上实现了语义角度的查询.该文将从全文检索的基础出发,首先介绍检索技术的发展及全文检索的特点,然后对目前几种主要的检索模型进行介绍和比较,其中包括布尔模型、向量空间模型以及概率模型,其后着重对LSI技术及作为其基础的向量空间模型进行详细介绍,最后介绍基于LSI技术的中文全文检索系统的设计与实现.
其他文献
本文研究了一个空中交通仿真训练系统的设计与实现。通过面向对象技术在空中交通仿真研究中的应用,创建了飞机对象的概念及其各种属性和方法,最终完成飞机控件的制作,介绍了该控
随着软件工程技术的发展,已经有众多的软件开发支撑工具广泛应用于业界,随之带来的问题是这些工具往往孤立地解决一类软件开发问题,譬如需求管理、任务管理、配置管理和缺陷管理
本文对基于CPN的多级安全工作流MLS_CPN无法完全表达控制流依赖的弊端,提出采用系统约束的手段对工作流过程定义进行丰富完善,并给出了将系统约束与过程定义相结合的方法。但是
工作流技术是近年来发展最迅速的几项新技术之一,其主要特点是实现人与计算机协作过程的自动化,使人以及各种应用工具相互之间协调工作,以完成某项任务.该文通过对基于Intern
工作流管理系统在当前的研究领域中,是一个热点.工作流管理系统对提高工作效率有重要的意义.目前已经出现了不少工作流产品和工作流原型系统,但是仍有诸多的局限性,如监控功
该文主要研究了跳频信号跳变时间的提取、快速跳频信号的测频以及跳频信号的网台分选.其主要工作可概括为以下几个方面.研究了小波变换提取跳频信号跳变点的问题.一是利用小
DPD(DistributedParallelDebugger)是基于Unix/Linux操作系统开发的源代码级并行调试器.DPD的设计采用分布式结构,主要模块包括:一个集成环境控制界面、一个数据流汇中心、多
本论文是上海市科委下达上海市计算技术研究所科研项目《全数字相控阵超声无损检测系统》的部分工作,侧重于算法的研究和实现。论文首先介绍了关于无损检测、超声波检测以及相
单体架构已经难以满足大规模复杂应用系统在灵活可伸缩和高可扩展等方面的需求,并导致系统技术选型成本高和交付周期长等问题。为了应对上述问题,一种新型的轻量级软件架构——
学位