基于用户反馈和日志挖掘的个性化检索

来源 :华南理工大学 | 被引量 : 0次 | 上传用户：crazyinlove_2008

【摘要】

：

目前,搜索引擎已经成为人们在海量网络数据中获取信息的最重要的途径。然而用户查询大多是简单而模糊的,搜索引擎往往无法一步到位地理解用户真正的检索意图,因此,当不同用户

【作者】

：

陈胜荣

【机构】

：

华南理工大学

【出处】

：

华南理工大学

【发表日期】

：

2008年期

【关键词】

：

搜索引擎搜索引擎网络信息网络信息个性化检索个性化检索用户行为用户行为日志挖掘日志挖掘聚类分析聚类分析

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目前,搜索引擎已经成为人们在海量网络数据中获取信息的最重要的途径。然而用户查询大多是简单而模糊的,搜索引擎往往无法一步到位地理解用户真正的检索意图,因此,当不同用户提交同一个查询词时,搜索引擎往往只能不加区分的返回同样的检索结果。实践证明,用户检索的目的是多种多样的,即使是同一个查询词,不同用户对检索结果的期待也往往各不相同。为此,国内外专家已经开始了大量的研究,提出了一些新的检索方法,并尝试将用户兴趣、行为反馈、日志信息以及网页内容结合起来,使得网络信息检索技术朝着个性化的方向发展。个性化检索系统是指那些针对不同用户背景返回不同检索结果的信息检索系统。在这些系统中,文档的相关性是基于不同用户的背景和兴趣而单独计算的。而用户的兴趣和背景通常通过用户反馈来获取。本文在木棉搜索引擎的基础上,以个性化检索相关理论为依据,按照“用户反馈搜集--用户建模-一个性化重排序”的流程顺序展开研究,并为木棉检索搭建一个个性化检索平台。论文的主要工作包括： 1、使用异步消息传递来收集隐式用户反馈,避免了传统客户端数据收集方式所存在的不足,完备的用户行为日志可以为以后的研究提供数据基础。 2、基于VSM模型构建用户描述文件,对检索结果进行个性化重排序,并做了效果评估。初步测试证明：个性化检索确实具有较好的效果。 3、研究和分析了查询日志,实现查询词相似搜索和相关搜索,利用用户点击流信息实现了基于用户历史点击的个性化重排序并评估。 4、实现了搜索结果的聚类,方便用户浏览,并提出使用聚类标签进行查询扩展,较好地改善了用户二次检索的效果。

其他文献

基于XIP运行方式的存储结构的研究

随着信息技术和世界经济的飞速发展,嵌入式系统越来越受到人们关注,越来越多基于嵌入式技术的产品进入人们日常生活中。本文首先对比了嵌入式系统的存储结构与通用PC机的

学位

嵌入式系统嵌入式系统Linux平台Linux平台串行闪存串行闪存存储结构存储结构代码执行方式代码执行方式

嵌入式Web远程监控技术在污染源自动监控系统中的应用

随着我国经济的高速发展,环境污染问题日益突出。作为我国的一项基本国策,环境保护是落实科学发展观、可持续发展、构建和谐社会的重要内容。环境监测作为环保各项工作的数据

学位

嵌入式嵌入式Web服务Web服务远程自动监控远程自动监控污染源污染源TCP/IP协议TCP/IP协议CGI技术CGI技术系统构建系统构建

基于手机平台的PDF417条形码识别方法的研究

现如今,人们对手机的要求已经不仅仅局限于通话本身,而更关注于将越来越多的应用集成在一起。从通话、短消息到上网、收发E-mail,再到今天的照相、摄像,手机的功能已经越来越

学位

二维条形码二维条形码条码识别条码识别手机平台手机平台PDF417PDF417

基于UPnP的家庭网络QoS研究与实现

随着技术的发展,越来越多的家庭设备将具备网络连接和数据通信能力。人们希望通过某种方式在各种家庭设备间实现信息的共享以及设备间的互操作。以家庭多媒体通信、娱乐、安

学位

家庭网络家庭网络服务质量服务质量控制协议控制协议

分散搜索算法解决多目标优化问题

分散搜索算法(Scatter Search Algorithm)是一个基于种群的进化算法。它的基本策略是创建综合决策规则和约束条件,其目的是通过组合两个或多个元素(解)以获取一个更好的新元

学位

分散搜索算法分散搜索算法多目标优化多目标优化算法设计算法设计

多方会议系统发言权控制的研究和实现

随着多方视频会议等多媒体实时通信应用的增多,多用户间的通信协调机制的研究和实现也越来越受到重视。其中,发言权控制是协调参会各方使用会议共享资源的一种重要手段。长期

学位

多方视频会议多方视频会议实时通信实时通信通信协调机制通信协调机制发言权控制发言权控制BFCP协议BFCP协议信令格式信令格式

基于用户反馈和日志挖掘的个性化检索

其他学术论文