信息检索中的查询算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:sep
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅速发展,网上信息飞速增长。如何从这些海量信息中检索出所需要的相关信息已成为一个非常重要的研究课题。而由于用户用词歧义以及查询条件表达不完整等现象的存在,传统信息检索的结果难以达到用户的查询目标。因此研究信息检索中的查询扩展技术,通过对用户的初始查询进行扩展和重构,有效的解决此类问题,具有重要的实际意义和一定的理论价值。本文首先介绍了信息检索的发展概况和相关技术,分析和比较了几种典型的查询扩展技术的优缺点,包括在查准率、查全率、计算时间和占用空间等方面的性能比较。针对查询扩展中局部分析方法查准率不高的缺点,提出一种基于局部类别分析的查询扩展方法。该算法通过分析与用户查询密切相关的文档,从而得到与查询相关的文档类别,进而根据相关类别中的文档用词与用户查询用词的共现关系对查询进行扩展。通过与传统的局部分析方法、全局分析方法的实验对比,结果表明新算法具有更快的检索速度和更高的查准率。针对传统的信息检索模型只能进行精确匹配的问题,提出一种基于混沌神经网络模型的查询扩展方法。该方法利用混沌神经网络模型自身的记忆性、学习性和联想性,对用户的查询信息进行聚类分析和学习,跟踪用户的兴趣变化,从而推测用户的查询倾向,以用于扩展和重构用户的初始查询。通过与传统的向量模型的实验对比,结果表明新方法具有更高的查全率和查准率。最后,在已有信息检索算法的基础上,结合所提出的改进算法,实现了一个基于查询扩展策略的信息检索系统。
其他文献
本文讨论了如何在分布式环境下构建一个容易根据需求快速开发的CTM(计算电话管理)系统。CTM系统是一个基于语音板卡的管理系统,它通过调用语音板卡的功能接口来提供语音方面的
为了让网络提供日益扩大的网络需求,满足各种各样的网络服务要求,我们认真研究了TCP/IP的体系结构的特点,发现基于层次体系结构的TCP/IP网络有许多固有的缺陷,而非层次体系结构的
学位
近年来,随着多媒体技术和计算机网络的飞速发展,多媒体数据,特别是图像数据,正在以前所未有的速度呈倍增长。如何有效的管理与检索图像数据已成为目前信息检索领域中的重要课题。
众所周知,VoIP 可谓语音通信的未来。电信运营商宣称 IP 电话在语音通信时间中所占比例正在快速增长,由其带来的大量新兴电话服务已经得到运用。随着数据业务的迅速发展以及网
安全问题是信息化建设过程中不可回避的话题,在现代信息社会中,随着计算机技术的广泛应用,这一问题也就显得更加迫切。目前安全领域的技术门槛高、投入代价大、易用性差、互操作
近年来,随着无线应用需求和市场的不断增长,无线应用业务和WAP设备得到了不断的发展,手机上网开始日益流行。然而,由于移动设备使用的通信协议和标记语言与互联网中所使用的
备份集是对数据进行备份产生的数据集合。备份集的管理是数据备份系统中的一个不可或缺的部分。备份集管理的好坏直接关系到整个系统的性能,关系到备份集的有效使用,关系到介质
复合盘技术充分融合了硬盘的容量大和FLASH的速度快,功耗低的特性。对于移动计算设备来说,电池使用时间太短是一个致命的问题,而复合盘的低功耗能很好的解决这一问题。同时它
随着嵌入式系统的规模、复杂程度和可靠性需求的不断提升,模型驱动的体系结构开发方法已经成为复杂嵌入式系统开发的主流。体系结构分析与设计语言AADL(ArchitectureAnalysisan