搜索引擎中查询扩展的研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:jj1385173
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展以及人们对信息需求的日益迫切,搜索引擎已成为人们在网上搜索相关信息的一个必不可少的工具。在使用搜索引擎中,如何通过输入好的查询表达式来获得好的搜索结果是困扰网民的一个问题。查询扩展具有增强搜索引擎系统的易用性和查准率的作用。本文从创新性和实用性出发,重点对查询扩展子系统相关技术进行研究并进行了相应设计,具有积极的现实意义。   本文包括以下四个方面的主要内容:   (1)本文根据查询扩展词项的来源不同进行分类论述,对查询扩展相关技术进行了深入的分析,并总结了各种查询扩展方法的特点、优点和不足之处。   (2)在深入研究基于局部文档集的查询扩展和基于全局文档集的查询扩展的基础上,为了进一步提高检索性能,研究一种基于局部文档集的方法和基于全局短语挖掘相混合的查询扩展。实验表明,基于文档集混合的查询扩展在检索性能上得到进一步提高。   (3)在深入分析查询日志中的用户行为特点的基础上,本文研究一种基于查询日志的查询式提取方法以及一种基于查询日志的频繁查询项集挖掘方法。为了吸收基于文档集方法和基于查询日志方法的优点,研究并提出一种基于查询日志与基于文档集相混合的查询扩展方法。实验表明,基于文档集方法与基于查询日志方法混合的查询扩展在查准率方面要好于基于文档集的方法或基于查询日志的方法。   (4)为了验证本文的研究,设计了基于Lucene+Nutch的搜索引擎系统以及查询扩展子系统。为了使系统支持中文搜索和查询扩展子系统的设计,对Nutch进行了改进。  
其他文献
由于图像语义自动标注(Automatic Image Annotation, AIA)在基于关键词的图像和视频的检索与浏览上具有巨大的应用前景,AIA在近年来受到了人们的广泛关注。解决AIA问题的瓶颈
随着计算机技术的飞速发展和普及,计算机性能按照摩尔定律指定的速率发生着日新月异的变化。然而一味的提升性能逐渐凸显了计算机系统其他方面的问题,其中功耗能耗问题就是性能
随着现代网络技术的发展,大型网络应用系统在访问控制方面大多存在授权不灵活、扩展不方便等问题。RBAC96(Role-Based Access Control96)模型的提出对这种状况有了很大的改善
数据挖掘(Data Mining)就是指从大量的、不完全的、有噪声的数据中提取出隐含的、未知的、对决策有潜在价值的知识和规则。它融合了数据库、人工智能、机器学习、统计学等多
前混合水射流超细粉碎是一个复杂的、多环节的加工过程,各环节交互影响、相互制约,对粉碎效率、粉碎产品的质量具有显著影响。因此,实现前混合水射流超细粉碎煤粒系统的自动
学位
对等网流媒体点播系统由于其良好的交互性和可扩展性及较低的部署成本,已成为互联网视频的主要发展方向。但设计部署具有较高用户播放体验、较少服务器压力的对等网流媒体点
近来随着固定电话网的建设和固定电话的普及,利用电话网传播非法信息的行为引起了有关部门的高度重视。有关部门希望采取技术手段来保障国家安全,维护国家利益。部署一种固话
随着计算机技术的迅猛发展,实际应用也对信息处理技术提出了许多新的需求和挑战,其中显示处理数据的时态信息就是其中之一。作为客观实体的一个基本属性,实体演化发展过程中的时
无线传感器网络(Wireless Sensor Networks,缩写WSN)是一种基于无线通信技术,成熟的电子工艺水平以及稳定的嵌入式系统发展而来的一种对实际物理环境进行无线感知的技术。近
在瞬息万变的信息社会里,实现通信安全显得更为迫切和重要。目前,经典密码被认为是一种有效的解决办法并且得到广泛应用。然而,大多数经典密码算法的安全性依赖于计算复杂性理论