基于Hadoop的Slope One及其改进算法实现

被引量 : 0次 | 上传用户:new4sophia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
用户推荐系统是一种通过分析用户的个人喜好,例如用户浏览过或者已经购买的商品的信息,向用户推荐其可能喜欢的项目的智能系统。它可以在一定程度上帮助人们在海量信息中寻找自己喜欢的内容。用户推荐系统的核心是个性化推荐技术,现在比较成熟推荐技术主要基于协同过滤算法。但由于用户兴趣的不稳定性和模糊性,这些方法仍然不能够很好的理解用户喜好,从而影响了推荐的效果。相对传统的基于用户对项目评分的协同过滤算法,Slope One算法简单、高效。但该算法依赖于大量用户对待预测项目的评分,如果对预测项目的评分的用户没有或者较少,就会遭遇“冷启动”的问题。同时Slope One算法只考虑了不同用户间评分的相似性,而没有考虑同一个用户对项目评分的个人习惯,这些都可能对评分预测结果有所影响。为了解决这个问题,引入了项目的内容相似性,考虑了描述项目的关键字语义相似和项目类型相似这两个因素。利用这些相似性去度量项目间的相近程度,并结合用户对其他项目的评分提出了一种基于项目内容相似的Slope One算法。最后在Hadoop平台上,基于MapReduce分布式编程模型设计了一套Slope One及其改进算法的实现方法,并在标准的MovieLens数据集上进行实验。实验结果表明SlopeOne算法随着数据集用户评分记录数量的增加能够改善算法预测的性能。同时加入了项目内容相似因素的新算法可以在一定程度上解决原算法可能出现的预测精度降低的问题。
其他文献
简述了当前我国电力市场改革过渡期对安全校核工作的要求,并结合未来市场环境下中长期交易安全校核的实际需求和当前电力调度运行现状,提出了考虑安全约束闭环优化的中长期交
重视农业、农村、农民问题是我们党一贯的战略思想。新农村建设中的核心问题是农民问题,农民素质问题是农民问题的核心,农民素质水平的高低关系到新农村建设的步伐。目前,农
笔者构建了包含货币政策工具、资产价格和共同因子的马尔可夫体制转移的因子扩展的向量自回归(MS-FAVAR)模型。并运用广义脉冲响应函数研究了不同货币政策工具对资产价格冲击
中国特色社会主义制度已具有系统性特征,与之相适应,制度所内涵的基本价值也具备系统性。这个价值系统包括:政治价值:人民民主;社会价值:公平正义;经济价值:共同富裕;以及综
党的十八届三中全会从战略层面上提出了我国新一轮税制改革的目标路线图。财税改革的推进强调国家治理的重要作用,科学的财税体制是实现国家长治久安的制度保障。笔者从税收
本文以动态观和整体观作为研究狐惑病的主要方法,旨在构建起狐惑病从发病到诊断治疗的完整体系。认为"蚀于喉为惑,蚀于阴为狐"应为互文,狐惑并存是该病诊断的必需条件。指出
金融危机的爆发对我国对外贸易产业及其发展产生了重要影响。在当前经济增速不断下滑,对外贸易波动性逐渐增强的环境下,探寻对外贸易优化发展路径,重整经济发展引擎,有着重要
朱德贵主任医师业医30余载,临床经验丰富,用药有其独特之处,本文介绍其在临床上应用全蝎、蜈蚣治疗耳鸣、眩晕、咳嗽、胃痛的经验。
以高纯AFP为抗原,免疫BALB/c小鼠,取其脾细胞和小鼠SP2/O-Ag14骨髓瘤细胞融合,经2次亚克隆。建立5株稳定分泌抗AFP特异性单克隆抗体的杂交瘤细胞株。应用经纯化的该单克隆抗体进行