基于兴趣主题的查询扩展

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:lxm8154
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的强势发展,网络上的信息量成爆炸趋势增长,如何使人们快速、准确的在浩瀚的资源中发现自己需要的信息成为关键。目前的搜索引擎虽然在一定程度上缓解了这一矛盾,但仍然存在着许多问题,主要体现在以下几个方面:(1)关键词的同义和歧义现象,造成了用户的查询表示与实际的检索意图往往存在较大的差异;(2)个性化内容少,结果雷同,大部分搜索引擎仅仅采用基于一般意图(one-size-fit-all)的模式;(3)大部分用户进行信息检索时,一般仅仅使用1~2个关键词,造成无法准确检索出用户需要的内容,这就是所谓的“短查询”问题。基于兴趣主题的查询扩展技术的产生正是为了满足这一需求,它能为不同兴趣和背景的用户提供满足其个性化需要的搜索结果。 用户兴趣模型能否准确的反应用户的兴趣决定了系统提供的个性化服务质量,基于这个认识,本文围绕着用户兴趣模型的研究逐步展开。 首先对当前主要的Web挖掘技术和用户兴趣建模技术进行了分析,建立了描述用户的浏览行为与兴趣度之间关系的数学模型。考虑到用户行为的个体差异性,设计了一个用户浏览行为与兴趣度关系的建立与更新算法。该算法可以针对每一个用户的特点,综合利用用户的隐式反馈和显式反馈获取用户感兴趣的网页。 接着,探讨了基于兴趣主题的查询扩展技术。与传统的兴趣模型不同,本文采用了一种改进的兴趣模型,引入了文档生命值,在此基础上,提出了用户兴趣的生成和更新与个性化查询扩展两个算法,结合了局部分析和基于用户日志的查询扩展的优点,在一定程度上避免了局部分析方法中扩展源选择不好的问题。 最后,在进行上述理论分析和研究的基础上,设计了一个基于兴趣主题的查询扩展系统,并进行了相关测试,将基于兴趣主题的查询扩展方法与传统检索方法和局部分析方法进行了比较,结果表明,本文的方法能够有效的解决关键词的歧义现象,提高信息检索的准确率。
其他文献
随着用户个性化需求的增长,基于知识的产品配置设计逐渐受到人们的重视。本文通过对已有产品配置方法的研究,针对气动工具——钉枪的产品特点,给出合适的产品配置知识表示与
中国是制造业大国,随着信息技术的不断发展,中国制造企业将成为一个全面集成的数字化企业。企业传统管理信息系统是实现企业内部信息化的方案,但是缺乏与外部资源的交互,而电
随着Internet的飞速发展,IP网络视频数据的实时传输已经成为一个非常普遍的应用。但是,由于TP网络只能提供一种“尽力而为”的服务,使得视频数据在IP网络中传输的时候不能得
计算机网络对抗指挥与控制(Commamd and Control),指的是将企图(intention)和态势(situation)映射为指令(command)的明确任务、拟制方案、评选方案、制订计划和下令控制五个活
随着网络技术的飞速发展,网络上教育资源的数量以飞快的速度增长,同时也出现了大量专业的教育资源网站。资源数量的丰富多样,一方面为学习者提供了广泛的选择余地,另一方面用户往
如何更快、更准确的向用户提供所感兴趣的资源是信息检索发展的方向之一。解决这个问题的基础在于如何准确的获得用户的兴趣并把它表示出来,如何使信息资源具有应用程序可以
关联规则挖掘是数据挖掘领域的重要研究方向。关联规则反映的是数据之间一种内在的关联关系。发现数据间的这种内在联系,有利于决策者利用这些规则做出正确和合理的决策。
人群行为分析和异常检测是计算机视觉、模式识别和智能交通等的交叉研究领域,近几年已成为人工智能和视频监控技术等方面的研究热点。本文针对简单无结构场景和复杂结构化场景
目前在PC和工作站上,文字和数字处理的软件发展良好,以MS Word、MS Excel、MS PowerPoint为代表,包括WPS,另外有PDF格式的文本处理。随着多媒体的实现,在Word中集成了多种对
计算机网络会议是一个同步协作会议,通过网络会议,不同地区的与会者们能够使用与网络相连的计算机共同协作完成某些交互程序,例如:董事会议、科学讨论甚至是虚拟教室。在网络