论文部分内容阅读
在互联网时代,人们普遍使用搜索引擎来搜寻自身所需内容,但是检索时往往被淹没于信息海洋中。由于网络信息的动态变化和用户兴趣的迁移,往往在搜索引擎返回的结果列表中,很难找到符合用户需求的信息,即搜索准确性不高。对于不同用户的查询,搜索引擎一般返回如出一辙的结果列表,并未考虑用户兴趣的异同,即难以提供个性化服务。这显然已无法满足人们的需求。为了更好地利用搜索引擎,让人们享受更好的用户体验,个性化搜索研究具有十分重要的意义。通过全面分析个性化搜索的国内外研究现状,提出一种基于用户偏好面向社区群体的个性化搜索模型Friendship Personalized Search Model(FPSM)。本模型选取隐式反馈搜集用户行为,研究用户历史记录特点与内容,综合由网页半结构化特点改进的向量空间模型和信息增益方法来提取用户浏览网页的特征,以此作为建立用户偏好的基础。通过概率理论将用户、查询内容、网页特征三个要素紧密联系,构建查询和特征间的关联矩阵以及用户、查询和特征间的关联矩阵,以这两个矩阵来描述用户偏好。最后使用协同过滤的邻居算法计算社区用户对搜索结果列表中网页的偏好相似度,融合用户自身偏好和相似邻居偏好,给出一种线性网页评分函数,根据分数高低对原始搜索结果重排序。为适应用户偏好随时间的动态变化,根据用户搜索行为情况改进了牛顿冷却定律,作为时间衰减函数,将历史用户偏好记录进行衰减,为个性化搜索提供具有时新性的用户偏好,以体现用户偏好实时转变情况。为验证模型有效性,将提出的个性化搜索模型应用于搜狗搜索,为特定搜狗社区群体用户提供个性化的网页检索服务。实验结果表明,该模型的搜索结果相比搜狗历史结果,能取得更高精度,提升用户体验。但模型目前仅仅考虑通用的搜索,对于时下火热的社交搜索,匿名个性化搜索以及图像搜索尚未分析。这将是未来研究的方向。