论文部分内容阅读
随着互联网的持续发展和日益普及,互联网成了人们生活、工作和学习中不可或缺的一部分。每个用户既是信息的获取者也是信息的提供者,这使得网上的信息呈现几何级增长,涉及面极广。而传统搜索引擎无区别的搜索结果不能满足用户的个性化需求,个性化是搜索引擎发展到一定阶段的必然趋势。因此,本文考虑使用用户兴趣创建用户兴趣模型,参与信息的检索,开展了基于用户模型的个性化搜索研究。本文所作的主要工作如下:(1)介绍了个性化搜索引擎的工作原理,研究了信息检索相关理论,重点研究了基于用户兴趣模型的个性化搜索引擎的关键技术,其中包括向量空间模型(SVM)和其在文档匹配中的重要应用,即文档相似性计算。(2)对用户兴趣模型进行了深入研究,探讨了用户兴趣信息的获取途径、表示方法和建模方法等关键技术,采用了一种显隐式结合的用户模型。对传统的隐式建模方式作了改进,包括在添加权重时对兴趣词汇词性的考虑。之后给出了显隐式结合用户模型的初始化、建立和更新方法。并做了相关验证试验,得到了实验结论。(3)本文最后在Lucene框架上实现了基于用户模型的个性化搜索,并从个性化系统结构、流程、排序和评分四个方面分析了其具体实现。设计了相关测试实验,对文中提出的个性化算法进行了实验和分析。综上,本文以用户兴趣模型为基础,提出了一种新的基于用户兴趣的信息搜索模型,为个性化信息搜索技术的研究与应用提供了参考。