基于用户访问意图的网页动态建模技术的研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:jiahong222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当一个用户向搜索引擎提交一个查询时,其搜索意图可以分为以下三类:(1)寻找某一个站点—导航查询(Navigational Query);(2)寻找Web站点上的某种以静态形式存在的信息—信息查询(Informational Query);(3)寻找某类站点,这类站点能够提供下载或进一步的在线操作—资源查询(Resource Query).目前虽然很多搜索引擎提供了一些交互功能来设法获得用户的搜索意图,但用户仍然很难准确地表达他们的搜索意图。况且,获取用户意图并非搜索引擎的目的,其真正的目的应该是根据用户意图提供相应的检索结果。而目前的搜索引擎返回的结果大多包括用户想要的和不想要的信息,特别是,用户想要的结果很多不能被排到返回的前几页。本文通过归纳用户的搜索意图以及每种搜索意图需求的信息类型,进一步提出三种搜索意图之间的搜索关系:信息型查询是导航型和资源型查询的开始,或者说导航型和资源型查询是信息型查询的目的。根据这种关系,提出基于意图的Web网页动态建模的思想。基于该思想,设计并实现了一种简单易行的网页聚类算法,分别以关键字包含、格式包含、类型包含为相似性度量,从而实现了根据上述三种意图对搜索引擎返回的网页聚类的过程,以便为不同的访问意图返回不同的聚类结果。与其它相关工作对比,本文的工作重点并非获取用户意图,也非对用户意图进行分类,而是基于目前用户意图的三种分类对搜索引擎返回的网页建模,模型能够为不同访问意图的用户提供所需信息的选择。本文的方法不仅能够基于用户搜索意图对Web网页进行动态建模,而且通过该模型为具有不同搜索意图的用户提供检索导航,最终为不同搜索意图的用户提供不同的搜索结果。
其他文献
切实加强运输安全生产的监督管理,保障人民群众生命财产安全,是各级道路运输管理部门的重要职责。长期以来,由于运管职能部门信息化程度低,缺乏大量数据及先进技术的支持,管理决策
学位
一个多维数据库上的skyline,是此数据库上不被其它任何数据点支配的点所组成的集合。skyline计算以其在多目标决策、数据挖掘、数据库可视化等方面的广阔应用获得了越来越多
近年来,随着FPGA技术的出现,凭借着它在设计上的优越性,使得它在各电子设计领域上备受关注。在数字控制系统的应用领域也越来越广泛。本课题主要研究了FPGA技术和无线通讯技术在高频感应加热控制系统的应用,目的在于实现一个安全稳定的高频感应加热环境。本文首先介绍了高频感应加热系统所涉及的一些概念及所要用到的一些技术。然后对系统实现的原理及实现可行性进行了深入的研究分析,确定了主电路的拓扑结构为串联谐振
随着高清电视和高清视频节目的发展,传统的DVD已经无法满足高清视频节目的需要。国外提出了两种蓝光高清标准,即HD-DVD和BLU-RAY DISC,但是这两种蓝光高清标准技术复杂、成本
组播作为下一代网络的一种重要业务,日益得到各方关注。未来光传送网将承载诸如视频会议、视频点播等实时业务。这些业务正是以组播为基础实现的。以DWDM为基础的光网络组播
当前,网络嵌入式系统(如无线传感器节点)成为了很多安全攻击的目标,包括一些要求物理访问设备的攻击。与此同时,由于计算资源有限,嵌入式系统在防护安全攻击上存在一定的困难
目前,云计算作已经在学术和商业上都取得了巨大成功,它作为一种新的计算范式不断促使新技术的产生。软件即服务(Software as a Service)已经成为云计算为用户提供服务的重要
随着互联网的发展,网络上的信息量骤增,网络应用日益普及,网络与信息系统的基础性、全局性作用日益增强,网络上也存在各种内容非法以及各种威胁网络安全的攻击入侵行为,所以,
随着信息量的快速增长,信息的重要性也在不断的提高,而数据作为信息的表现形式,其完整性和安全性成为系统安全的重要内容。数据备份是维护系统安全性和可用性的重要手段,而如