基于Web的个性化信息检索研究

被引量 : 0次 | 上传用户:daguofan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于Internet上的信息具有数量庞大、无序性强、重复性大的特点,互联网上的各种信息检索系统——搜索引擎成为帮助人们上网获取信息的主要工具。这些搜索引擎在给人们带来很大便利的同时也暴露出许多问题。搜索引擎返回给用户的检索结果数量越来越大,人们越来越难以找到真正符合自己意图的信息。因此,如何提高搜索引擎的检索效率和如何更快更准确的向用户提供检索信息成为本文关注的唯一内容。 本文致力于从Web个性化信息检索系统的系统结构、网页分类、用户个性化模式的表示等三个角度来分析,主要包括以下工作: 1.对现有的信息检索系统进行分析 分析了当前Web信息检索系统的发展过程和发展趋势,并分析了Web信息检索系统所涉及的关键技术及相关知识。在此基础上,分析了当前信息检索系统存在的一些不足之处,如随着Internet规模和用户的飞速发展,如何向用户准确提供他们所需要的内容问题;特征词与网页分类相结合进行信息检索问题。 2.提出基于Web的个性化信息检索的体系结构 首先介绍了个性化信息检索的概念,然后对实现个性化信息检索的各项技术进行论述。结合分析本体论提出特征词和网页分类相结合的检索方案,将现有的基于关键词层面的信息检索提高到基于知识(或概念)层面的信息检索,可以大大提高信息检索效率。最后从用户角度和资源角度来分析、构建出一个具体的个性化信息检索系统,一个个性化信息检索系统包含两个基本组成部分:用户个性化信息(用户兴趣)的收集、整理系统和用户个性化信息的支撑系统,即Web资源的组织、分类和推荐。 3.提出一种基于静态二叉树的个性化模式表示方法及相应的文档过滤算法 如何更快、更准确的向用户提供其所感兴趣信息是当前搜索引擎系统发展的方向之一。解决这个问题的基础在于如何准确的获得用户的兴趣并把它表示出来。本文提出了一种基于静态二叉树形式的个性化模式表示方法。在这种个山东大学硕士学位论文性化模式表示的基础上,给出了文档过滤算法。这种用户个性化模式的表示方式的最大优点能提高W七b文档过滤的效率,减少用户等待时间。关键词:个性化信息检索;本体论;用户个性化模式;静态二叉树II
其他文献
本文基于对农业重要性的认识,在综述国内外农业结构调整发展动态的基础上,以寿阳县农业生产区域为对象,采用调查分析、比较研究、综合评价方法,对农业结构调整的内在驱动力、
对教师话语的研究始于20世纪70年代,率先进入这一领域的是美国的Gaies,Henzel, Krashen, Chaudron, Richards等人。语言既是教学的目标又是用以达到此目标的工具。教师在课堂
再审事由是启动再审程序的关键。我国现行民事诉讼法规定的启动再审程序的事由过于宽泛、原则,既不利于保护当事人的合法权益,又不利于维护法院生效裁判的稳定性和权威性,因此对
本文试图运用企业核心竞争力理论,通过对核心竞争力理论与实际企业管理模式之间关系的探究,以及通过分析和设计石化企业核心竞争力评价指标体系来全面的对中石化在竞争规模、
回顾了南极臭氧洞的发现过程,评述了南极臭氧洞形成和发展的机制、以及南北极臭氧变化的差异,讨论了南极臭氧洞的发现和研究带来的启示。研究指出,目前只是在南极春季出现了
预防性储蓄理论是西方新近发展的储蓄理论,它主要研究不确定情况下居民的储蓄行为,是对传统储蓄理论的重要拓展。国内学者在利用西方预防性储蓄理论来分析我国居民储蓄行为时
中医认为药有个性之特长,方有合群之妙用,药物之间配伍使用即成方剂.药对乃两种中药配伍成对,在处方中并用而达到协同增效,或针对某种病因病机,或某种病证治疗而组成的特殊配
对工业正己烷装置进行扩能及精制工艺改造,使工业正己烷产品的生产能力从1900t/a增至3000t/a;精制后高纯正己烷产品含量达到97%,苯含量小于1mg/kg,硫含量小于1mg/kg,达到药用
本研究从社会环境、心理因素二个方面来研究大学生的网络成瘾的形成原因,试图寻找出一些能够提前采取措施加以控制的导致网络成瘾的因素,以便能够做到防患于未然。本研究采用
文章在调查嘉兴市看守所、劳教所、遣送站和65名外地籍短刑犯、犯罪嫌疑人、劳教人员的基础上,分析了流动人口治安管理工作中存在的薄弱环节,并从比较宏观的层面提出改进和加