基于相关反馈的人机对话搜索引擎系统

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:zjlzjl943
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的迅速发展和广泛普及导致网上信息爆炸性增长,如何在庞大的互联网上获得有价值的信息已成为用户日益关注的问题。搜索技术的出现为用户快速找到所需信息提供了方便。搜索引擎是一种用于帮助因特网用户查询信息的搜索工具,它以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。随着搜索引擎技术不断向前发展,搜索引擎成为用户用来检索网上信息的主要工具。 然而目前的搜索引擎仍然存在不少的局限性。比如查全率低;查准率低,搜索结果与请求相差较大;各搜索引擎的语法不统一,用户难以掌握;检索策略简单,组合检索能力差;缺乏专门面向某一学科的专题性搜索引擎;搜索引擎的智能程度还很低等。因此,搜索引擎一直在努力进行改进,搜索引擎技术正成为计算机工业界和学术界争相研究、开发的对象。研究目的就是在不提高用户进行检索的难度和效率的情况下,尽量使用户得到更有相关性、包含更多信息的网页。本文正是为了这一目的所做的研究。本文设计并开发了一个基于相关反馈的人机对话搜索引擎系统,以实现用户期望的个性化查询,提高查询的精确度。利用用户认为符合检索目的和不符合检索目的的搜索结果作为反馈信息,依据向量空间模型的原理对用户反馈的搜索结果进行分解计算,分别得出符合用户查询要求和不符合用户查询要求的文本特征向量,根据候补网页与他们的相关程度得到离用户查询要求更接近的候补网页,作为再搜索的结果提交给用户。这样不仅提高了搜索引擎系统的准确率,也避免了用户以输入关键词的形式来进行信息反馈,从而使得查询更加智能化和人性化。
其他文献
分布式全文检索技术是信息处理领域的核心技术之一,目前被广泛应用于竞争情报、信息检索、搜索引擎以及信息过滤等领域。对高效分布式全文索引技术的深入探讨不仅拥有重要的理
随着身份欺诈行为事件的不断发生和对自动身份识别应用的强烈需求,基于生物特征的身份验证尤其是基于指纹的鉴定已引起了社会的广泛关注。指纹具有唯一性和稳定性,因此被人们用
该文给出了基于校园网的模拟在线考试系统的系统结构,并在分析C/S模式存在不足的基础上,研究了B/S模式的网络结构、特点、各发展阶段技术,特别是着重研究了构造B/S模式信息系统
XML Web服务技术是eBusiness On Demand系统的首选技术。使用这些技术架构起来的系统具有模块化、松耦合、可扩展、语言平台无关、整合度高等特点。而这些特点正是当前电子商
随着各种网络应用和企业信息化系统的普及并持续增长,数据集中和应用集成迫切需要可管理、易伸缩、高性价比的数据共享解决方案。集群系统正是满足这样要求的一个具备强大处理
云计算的概念自提出以来,即在全世界范围内得到了广泛应用。云计算凭借其高度并行性、虚拟化等特点大幅简化了程序员的工作,提高了作业执行速率。MapReduce作为云计算中的核心
VoIP是随着Internet商业化革命以及网络融合技术的发展而兴起的一门通信技术。它最大的优势是能广泛地利用Internet和全球IP互连的环境,提供比传统业务更多、更好的服务。在当
本文介绍了大学生教务管理信息系统,此系统是一个基于Web的网上教务管理信息系统。学生通过浏览器登录到系统,可以查询自己的考试成绩、所得学分、课表安排,参与评教。教师登录
随着Internet技术的推广,基于Web的应用系统,得到了迅速发展。网络在人们生活中的普及,使它逐渐变得简单化、人性化,这些都增加了开发的难度。传统软件技术应用到基于Web的系
Peer-to-Peer网络(P2P)技术是目前热门的研究领域之一,它对传统网络的“以内容为中心”的服务模式产生很大冲击。P2P网络采用分布式结构,每个节点既是客户端又是服务器,这种