【摘 要】
:
搜索引擎是用户利用网络资源不可或缺的工具,离开搜索引擎用户几乎无法利用海量的网络资源。但是目前搜索引擎的查准率有待提高,这是用户继续使用该搜索引擎的必要条件。对于不
论文部分内容阅读
搜索引擎是用户利用网络资源不可或缺的工具,离开搜索引擎用户几乎无法利用海量的网络资源。但是目前搜索引擎的查准率有待提高,这是用户继续使用该搜索引擎的必要条件。对于不同的用户而言,即便是相同的查询词其期望的查询对象可能不同,那么搜索引擎此时的查准率其实就是让搜索引擎具有个性化搜索的特点。
个性化搜索引擎的关键是用户兴趣的确定和文档兴趣值的确定,只有把抽象的个性化兴趣量化成数值类的模型,才可以了解用户真正的需求和量化文档与兴趣的相关程度,从而准确地对网页进行筛选并达到个性化排序的功能。
本文充分吸收了模糊理论、模糊概念网络、粗糙集等理论知识,在此基础上设计出一个兴趣模型,此模型就是一个五元组它包括兴趣概念、词汇、文档、兴趣向量和向量计算函数来模型化兴趣,同时收集了一定量的权威文档,分别计算出它们针对某兴趣的兴趣向量,并以此兴趣向量为基础,组建基本兴趣数据库,以后对任何新文档的兴趣判断都转化为新文档兴趣向量与基本数据库中兴趣向量的相似值判断,从而解决了文档兴趣类型和兴趣值的问题。
本文第5章在兴趣模型、传统的页面计算方法和相关反馈技术的基础上,设计了一个个性化搜索引擎。
同时,本文针对用户在输入时容易输入模糊查询词的情况进行了模糊词量化处理,根据不同的用户兴趣,量化的结果是不一样的,从而更好的到达个性化搜索的效果。
论文最后对全文进行了总结,并对个性化搜索引擎的发展方向进行了展望。
其他文献
纹理合成与编辑是近年来国内外一个比较活跃的研究领域,有关纹理编辑与合成的研究在计算机视觉、图像处理及计算机图形学领域都占有重要的地位,有着非常广阔的应用前景。传统
近十几年来,随着信息技术和计算机技术的快速发展,对信息安全提出了越来越高的要求,并使得作为信息安全核心的加密技术及其实现变得越来越复杂。保障各种网络活动中的信息安全,成
随着机动车的日益普及,交通拥挤问题日益突出。在现有的条件下,如何提高交通控制和管理水平,合理使用现有交通设施,充分发挥其性能,是解决交通问题的有效方法之一。随着计算机硬件
工作流的建模和分析技术是商业过程的组织、管理以及工作流管理系统的设计和实现的基础。在设计和开发工作流管理系统时,首先要使用形式化的模型方法对工作流程进行正确、清
在以往的教学中,形成的是以教师为中心,教师讲授、学生接受的教学模式。这种教学模式有利于知识的传授和积累,有利于课堂教学的组织和实施,但同时也限制了学生自我发挥、探究
Web Service是基于组件的软件平台,是面向服务的Internet应用。它能够统一封装各种信息、行为、数据表现以及业务逻辑流程,而无需考虑应用所在的环境是使用何种系统和设备。
随着无线网络和多媒体通信技术的发展,移动多媒体业务将得到越来越广泛的应用。在移动通信系统中,如何根据用户的需求提供服务质量保证是移动多媒体通信发展过程中面临的重要
在视频压缩中,使用基于块匹配技术的运动估计能够有效去除视频序列之间存在的大量时间冗余,对于提高压缩的效率是至关重要的。采用全搜索算法可以得到最优解,但是它的实现需
随着Intemet领域的不断扩大,互联网络技术的高速发展,C/S和B/S软件架构已经不能满足现在不断出现的新需求。随着微软NET战略的推出,一个新的概念——智能客户端以其灵活充分使用客
信息技术和网络技术的发展的同时也带来了信息海量增长,因此如何将信息有效的分类以便人们更加高效的利用信息是一项艰巨的任务。文本形式的信息广泛应用于信息检索、文本数