基于用户偏好的个性化搜索模型研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:CrazyDesire
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网时代,人们普遍使用搜索引擎来搜寻自身所需内容,但是检索时往往被淹没于信息海洋中。由于网络信息的动态变化和用户兴趣的迁移,往往在搜索引擎返回的结果列表中,很难找到符合用户需求的信息,即搜索准确性不高。对于不同用户的查询,搜索引擎一般返回如出一辙的结果列表,并未考虑用户兴趣的异同,即难以提供个性化服务。这显然已无法满足人们的需求。为了更好地利用搜索引擎,让人们享受更好的用户体验,个性化搜索研究具有十分重要的意义。通过全面分析个性化搜索的国内外研究现状,提出一种基于用户偏好面向社区群体的个性化搜索模型Friendship Personalized Search Model(FPSM)。本模型选取隐式反馈搜集用户行为,研究用户历史记录特点与内容,综合由网页半结构化特点改进的向量空间模型和信息增益方法来提取用户浏览网页的特征,以此作为建立用户偏好的基础。通过概率理论将用户、查询内容、网页特征三个要素紧密联系,构建查询和特征间的关联矩阵以及用户、查询和特征间的关联矩阵,以这两个矩阵来描述用户偏好。最后使用协同过滤的邻居算法计算社区用户对搜索结果列表中网页的偏好相似度,融合用户自身偏好和相似邻居偏好,给出一种线性网页评分函数,根据分数高低对原始搜索结果重排序。为适应用户偏好随时间的动态变化,根据用户搜索行为情况改进了牛顿冷却定律,作为时间衰减函数,将历史用户偏好记录进行衰减,为个性化搜索提供具有时新性的用户偏好,以体现用户偏好实时转变情况。为验证模型有效性,将提出的个性化搜索模型应用于搜狗搜索,为特定搜狗社区群体用户提供个性化的网页检索服务。实验结果表明,该模型的搜索结果相比搜狗历史结果,能取得更高精度,提升用户体验。但模型目前仅仅考虑通用的搜索,对于时下火热的社交搜索,匿名个性化搜索以及图像搜索尚未分析。这将是未来研究的方向。
其他文献
凸壳问题是计算几何中最重要、最基本,也是得到大量深入研究,并有广泛应用的问题之一。其应用领域包括统计学等。它是在20世纪提出的,70年代以来,二维凸壳所具有的问题复杂性与应
随着Internet的迅猛发展,Web上可获得的Web服务急剧增多,如何从庞大的服务群中有效地获得所需功能的Web服务和如何在功能相似的Web服务中找到最佳服务成为了值得关心的问题,这些
在当今移动互联网时代,Android智能设备融入到人们生活的方方面面并且被人们重度依赖。大量的个人隐私数据,如联系人、通话记录、短信、照片等保存在其中,人们非常关切个人隐
本文介绍了XML语法的主要特点以及DTD、Schema的使用;阐明了XML数据在数据库中的存储方式;重点从三个角度讲述了XML在关系数据库中的存储方法:独立于模式的XML数据在关系数据库
网格计算作为下一代互联网技术成为当前国内外研究的热点。资源管理与调度算法是网格计算中的两个核心问题。本文以现有主流的网格中间件Globus为基础平台,以校园计算网格为
随着存储需求的增加及存储应用日益复杂,对象存储接口将逐步取代以块和文件为访问单元的存储接口,成为将来存储系统发展的主要趋势。利用光纤通道协议传输对象存储设备的命令
图形质量和绘制速度是三维实时绘制技术的主要矛盾。三维实时绘制的场景常常包含数百万甚至上千万的三角形,而且其几何模型还有越来越复杂的趋势。传统图形流水线完全依赖CPU
创建逼真的三维人脸模型以及人脸动画是计算机图形学领域一个极富有挑战性的课题。随着影视特技、电子游戏、可视电话、虚拟会议等应用的发展,这一领域越来越受到人们的重视
随着互联网应用的飞速发展,分布式缓存作为服务器端缓解数据库访问压力的关键组件,越来越起着不可替代的作用。然而随着多核处理器的广泛使用,传统的分布式缓存在多核环境下
随着我国社会主义市场经济的不断发展,迫切需要建立适应市场需要的内部生产管理体制。《项目施工集成管理软件系统》采用项目管理,推行项目经理负责制,能密切专业间的协调关