基于用户信任度和社会化标签的协同过滤算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:catticc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的广泛普及和电子信息技术的飞快发展,网络成为人们获取信息的重要方式,数据正在以超凡的速度呈现爆炸式增长。分类目录、搜索引擎等传统的网络服务已经不能满足人们的个性化信息需求,推荐系统应运而生。目前个性化推荐技术被广泛应用到诸如社交网站、电影音乐网站、电子商务等系统中,以提升用户体验,增强网站竞争力。协同过滤算法以稳定、简单等特性,成为应用最广泛和成功的个性化推荐算法之一。但传统协同过滤算法仍存在许多问题,包括:1)稀疏性:过度稀疏的评分矩阵,无法有效衡量用户之间的相似性;2)多兴趣模型:传统协同过滤基于单一用户兴趣模型进行推荐,当用户有多个兴趣,且兴趣跨度较大时,基于单一兴趣模型预测的结果将会出现很大偏差;3)兴趣变化:传统协同过滤假定用户兴趣一成不变,而现实生活中用户的兴趣是不断变化的。本文针对以上问题,综合利用评分数据和社会化标签信息,提出了两种改进的协同过滤算法。第一种是基于项目属性偏好和信任度的多兴趣推荐算法。首先基于用户评分和项目属性信息构造用户-项目属性偏好矩阵;然后综合用户的评分相似性和项目属性偏好相似性初步筛选近邻;接下来尝试用本文提出的用户级用户信任度融合上述综合相似度共同选取K近邻;最后在预测评分时,用本文提出的基于特定用户和特定项目的用户信任度融合上述综合相似度作为推荐权重。第二种是基于时间和社会化标签聚类的协同过滤。首先通过Word2vec语言模型生成社会化标签的词向量;然后对标签词向量聚类,并借鉴TF-IDF思想构造用户-标签类别偏好矩阵;接下来考虑用户动态标注信息反映的用户兴趣变化,设计一种时间衰减函数作为标签类别偏好权重;然后计算用户相似性并产生预测评分。最后将两个算法进行混合,通过在Movielens数据集上进行多组实验,验证了本文算法有效地改善了数据稀疏性、兴趣模型单一和兴趣变化所导致的推荐结果不准确问题,比其他相关改进算法推荐效果更好。
其他文献
论述了新形势下高校纪检监察工作应重视的问题 :1.一要自律 ,二是监督 ;2 .加强监督 ,贵在主动 ,协调配合 ,形成合力 ;3.加强党纪政纪的宣传教育工作 ,注重党风廉政建设责任
通过对不同浓度盐胁迫下石竹种子萌发特性、幼苗生长和生理特性等指标的测定,研究盐胁迫对石竹种子萌发、幼苗生长的影响。结果表明:50 mmol·L^-1盐胁迫对石竹种子萌发
根据上下文猜测词义是高中生在英语阅读中必须要掌握的一项基本技能,词义猜测题也是高考阅读理解的必考题之一。考生熟悉和掌握常用的猜词技巧,有助于提高英语阅读理解能力。
<正>邹城市是亚圣孟子的故乡,素有"孔孟桑梓之邦,文化发祥之地"之美誉,民族文化积淀深厚。"平派"鼓吹乐是这块土地上民族音乐的代表,它是鲁西南各派鼓吹乐中风格最独特的一派
<正>随着生活水平的提高,脑血管疾病发病率近十几年来迅速攀至各大疾病之首[1],严重威胁人类的健康。我国缺血性卒中发生率正以每年8.7%的速度上升,发病者约30%死亡,70%的生
柔印工艺的技术控制涉及到生产过程中的方方面面,要注重从版材的合理选择到制版工艺技术的设计,还有印刷过程的工艺技术环节,都要全面进行技术把关和控制,以便在生产过程中有
公共服务是为满足社会公共需求、维护公共利益,由政府直接提供或由政府提供保障的公共产品和服务。改善公共服务是21世纪公共行政和政府改革的核心理念,也是我国建设服务型政