论文部分内容阅读
传统的搜索技术满足了人们一定的需要,但由于其通用的性质,仍然不能满足不同背景、不同目的和不同时期的查询请求。个性化服务技术就是针对这个问题而提出的,它为不同用户提供不同的服务,以满足不同的需求,实现针对不同用户进行相应信息筛选的目的。个性化服务技术能够充分提高搜索引擎的服务质量和访问效率,吸引更多的访问者。
个性化搜索引擎是一种通过机器主动学习用户兴趣,并根据用户兴趣帮助用户进行信息筛选的新一代智能化搜索引擎。本文在对第二代搜索引擎分析的基础上,运用“隐式反馈技术”和“向量空间模型”,设计并实现了一个完整的可学习用户兴趣并可动态调整的个性化搜索引擎。本文的主要工作有:
第一,对目前的搜索引擎技术和个性化信息检索技术进行了较为全面深入的探讨和综述。对于目前已经有的和正在探索中的各种个性化信息检索与提取技术进行介绍和分析。
第二,在用户兴趣提取中,采用了基于隐式反馈技术的多级信息提取方法,提取用户点击历史中的信息。在其中采用了提取即时隐式反馈信息的多级信息沉淀的方法,能对用户短期的兴趣信息进行提取,以适应用户短期的异常行为,同时也可以通过这些信息描述用户兴趣的转移。
第三,在文档的相似度比较方面,采用了向量空间模型,并结合了布尔模型的优点进行了维度复杂性计算方面的改进。对于即时的隐式反馈信息,采用了一种挖掘关键词相互关系的算法来进行用户兴趣种类的判别并根据用户行为的上下文信息做出相应评价。
第四,对每一次搜索,记录用户的点击历史并进行相应的分析,评价用户对于搜索结果的满意度,并动态得对搜索结果进行调整。
本文所设计的搜索引擎能获得对于用户具有较高相关度的搜索结果,减少用户的检索负担,使用户能从大量繁杂的信息中迅速提取到对自己有用的信息,对于提高网络信息的利用效率和用户的工作效率具有十分重要的现实意义。