论文部分内容阅读
互联网技术的飞跃式发展,促使WWW网络拥有的Web站点和信息资源剧增,面对如此庞大的信息,用户检索的资源虽然变得愈加丰富,但是,搜索引擎检索出的结果有时也难以让用户满意。用户的查询是一系列检索服务活动的开始,如果没有理解用户查询的真实意图,即使后面的一系列模型或算法设计再好,也不可能返回用户所需的结果。因此,面对用户高质量的检索结果要求,准确理解用户需求是解决当前搜索结果“千篇一律”的重要办法。用户的检索是具有上下文环境的,虽然目前的检索系统因其利用了某些上下文信息,改善了原有搜索结果重复率高的现象,但搜索效果有时因搜索引擎忽略其它上下文信息而不够理想。因此,有必要综合分析不同上下文信息对用户检索行为的影响,权衡各种上下文对用户查询的影响权重;另外,上下文作为一种重要的信息资源,对其不合理地利用会引发用户隐私的泄露,并且系统在感知用户检索所处的上下文环境信息时,还需分析哪些是用户不愿意或不允许Web站点共享的隐私或敏感信息,进一步保证隐私信息的安全。为此,针对现阶段信息检索领域出现的未有效使用上下文信息及用户隐私问题,本文提出了隐私保护增强的上下文感知搜索,主要完成的工作如下:(1)发放问卷。本文将搜索环境下的上下文信息划分为用户、查询及页面上下文三类,借助网络力量,在相关网站上发放问卷,分析并判断哪些上下文信息对用户检索有效,挖掘利用上下文信息进行检索的价值及对比各种上下文信息对用户搜索行为产生的影响。(2)构建支持隐私保护的用户兴趣模型。首先,分析隐私信息的性质、影响及隐私保护方面的相关研究;其次,描述用户检索历史的获取方式、用户兴趣模型的特点和表示方法;最后,设计支持隐私保护的层次用户兴趣模型。与普通用户模型最大的区别:1)增强隐私保护,模型中节点信息不仅包含其语义、权重值,还包括敏感值;2)系统将根据节点敏感值的大小,决定对包含该节点的相关主题进行修剪的程度。(3)隐私保护增强的上下文感知搜索框架。将支持隐私保护的用户模型放入该框架中并设计框架的实现算法,该框架形象地描述了系统的工作流程及原理。(4)系统的验证与评估。采用邀请用户试用系统并对检索结果评分的实验方式对支持隐私保护的用户兴趣模型的有效性进行评估与验证。