论文部分内容阅读
在浩如烟海的互联网信息世界中,通过现有的搜索引擎,人们寻找有用信息还是存在着很大的困难。究其原因,一是用户信息需求的特定性、有限性和互异性与信息资源分布的无限性、分散性之间存在矛盾;二是现有搜索引擎的缺陷与信息检索服务之间不相适应。现有的搜索引擎存在覆盖率低和查准率低的缺陷,无法充分满足人们的搜索需求。元搜索引擎通过调用多个搜索引擎来实现搜索,并对搜索结果进行综合处理,能较好解决现有的搜索引擎所存在的缺陷。为了满足用户搜索需求的特定性,通过对用户特性进行建立用户模型,在元搜索引擎上引入个性化的搜索,达到提高搜索精度的目的。由于元搜索引擎是建立在现有的搜索引擎之上,它同样存在现有的搜索引擎采用的机器搜索带来的种种问题。为了解决这个问题,近几年来随着Web2.0技术的发展,人们提出社会化搜索的概念。社会化搜索是一种基于人的搜索,其目的是通过搜索引擎的众多用户的集体智慧获取和改善搜索结果。本文在元搜索引擎上引入个性化搜索和社会化搜索,为用户的个性化搜索需求服务,并展开了相关研究。论文提出了一种基于本体论的个性化搜索与社会化搜索相结合的元搜索引擎的系统结构模型;提出了个性化和社会化搜索相结合的方法,提高用户搜索的精度。论文对用户模型进行着重的研究,提出了一种新型的用户模型。它是以基于本体论建立的层次型主题分类参考模型为用户模型形式,结合用户个体模型和用户群体模型,并对用户的多项特性进行建模;通过强化学习对用户模型进行更新。论文在个性化搜索的研究中,提出了一种基于用户兴趣模型的用户查询意图分析算法;对基于混合学习法的成员搜索引擎选择算法进行改进,提出了一种结合用户成员搜索引擎偏好模型的混合学习法的成员搜索引擎选择算法,它具有个性化选择和选择速度快的优点;对基于加权合成法的搜索结果排序算法进行改进,提出了一种基于用户兴趣模型的位置/全局相关度的搜索结果排序算法。论文在社会化搜索的研究中,对一种结合文档内容的PageRank算法的应用领域进行扩展,将它的原理应用于对兴趣圈内的用户进行重要性评价,提出了一种计算用户人气度的ScoreRank算法;并提出了一种结合用户兴趣模型、用户收藏模型和收藏内容分析的收藏搜索结果的排序算法。