基于用户反馈和日志挖掘的个性化检索

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:crazyinlove_2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,搜索引擎已经成为人们在海量网络数据中获取信息的最重要的途径。然而用户查询大多是简单而模糊的,搜索引擎往往无法一步到位地理解用户真正的检索意图,因此,当不同用户提交同一个查询词时,搜索引擎往往只能不加区分的返回同样的检索结果。实践证明,用户检索的目的是多种多样的,即使是同一个查询词,不同用户对检索结果的期待也往往各不相同。为此,国内外专家已经开始了大量的研究,提出了一些新的检索方法,并尝试将用户兴趣、行为反馈、日志信息以及网页内容结合起来,使得网络信息检索技术朝着个性化的方向发展。 个性化检索系统是指那些针对不同用户背景返回不同检索结果的信息检索系统。在这些系统中,文档的相关性是基于不同用户的背景和兴趣而单独计算的。而用户的兴趣和背景通常通过用户反馈来获取。 本文在木棉搜索引擎的基础上,以个性化检索相关理论为依据,按照“用户反馈搜集--用户建模-一个性化重排序”的流程顺序展开研究,并为木棉检索搭建一个个性化检索平台。论文的主要工作包括: 1、使用异步消息传递来收集隐式用户反馈,避免了传统客户端数据收集方式所存在的不足,完备的用户行为日志可以为以后的研究提供数据基础。 2、基于VSM模型构建用户描述文件,对检索结果进行个性化重排序,并做了效果评估。初步测试证明:个性化检索确实具有较好的效果。 3、研究和分析了查询日志,实现查询词相似搜索和相关搜索,利用用户点击流信息实现了基于用户历史点击的个性化重排序并评估。 4、实现了搜索结果的聚类,方便用户浏览,并提出使用聚类标签进行查询扩展,较好地改善了用户二次检索的效果。
其他文献
随着信息技术和世界经济的飞速发展,嵌入式系统越来越受到人们关注,越来越多基于嵌入式技术的产品进入人们日常生活中。 本文首先对比了嵌入式系统的存储结构与通用PC机的
随着我国经济的高速发展,环境污染问题日益突出。作为我国的一项基本国策,环境保护是落实科学发展观、可持续发展、构建和谐社会的重要内容。环境监测作为环保各项工作的数据
现如今,人们对手机的要求已经不仅仅局限于通话本身,而更关注于将越来越多的应用集成在一起。从通话、短消息到上网、收发E-mail,再到今天的照相、摄像,手机的功能已经越来越
随着技术的发展,越来越多的家庭设备将具备网络连接和数据通信能力。人们希望通过某种方式在各种家庭设备间实现信息的共享以及设备间的互操作。以家庭多媒体通信、娱乐、安
分散搜索算法(Scatter Search Algorithm)是一个基于种群的进化算法。它的基本策略是创建综合决策规则和约束条件,其目的是通过组合两个或多个元素(解)以获取一个更好的新元
随着多方视频会议等多媒体实时通信应用的增多,多用户间的通信协调机制的研究和实现也越来越受到重视。其中,发言权控制是协调参会各方使用会议共享资源的一种重要手段。长期