推荐系统中相似度计算方法的研究

被引量 : 27次 | 上传用户:tcfan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
据统计,互联网海量数据中,非结构化数据的比例已经达到80%左右。互联网规模和覆盖面的迅速增长带来了著名的“信息超载”问题。一方面,丰富的信息资源为人们的生活提供了极大的帮助;另一方面,过量信息使得用户无法从中获取有用的知识,导致信息使用效率降低。为了缓解这个问题,需要一种信息过滤的手段来帮助人们在海量数据中找到有用的信息资源,推荐系统是当前解决信息超载问题非常有效的手段。基于协同过滤的推荐系统作为应用最广泛、研究最深入的一类推荐系统,在电子商务、社交网站以及各类资讯平台上都取得了巨大成功。协同过滤算法的关键在于寻找用户或物品的邻居,邻居的寻找依赖于用户或物品之间的相似度计算。因此,相似度计算的准确性决定了推荐结果的质量。如何提高相似度计算的准确性成为了推荐算法成功的关键问题。本文首先介绍了推荐系统领域常见的三类推荐方法,并对推荐系统的若干性能评测指标进行了介绍;然后对协同过滤算法进行了详细的实验分析,观察了邻居数量对推荐结果的影响规律,接着探讨了不同的相似度计算方法的适用场景以及它们的局限性。为了提高相似度计算的准确性,本文探讨了可能影响相似度计算准确性的四个因素,包括高频物品、共同评分用户的数量、物品评分权重、物品相似权重,同时给出了针对这些影响因素的改进算法。然后通过离线实验的方式验证了基于改进相似度计算的协同过滤推荐系统的性能要优于基于传统相似度计算的协同过滤推荐系统。本文最后利用Mahout平台下的Taste工具模拟了基于协同过滤算法、SlopeOne算法以及SVD算法的推荐系统,并且在MovieLens数据集下进行了性能的测评与对比,分析总结了不同的推荐引擎各自适用的场景以及性能的优势。
其他文献
钢琴二重奏原是从钢琴教学中发展起来的一种演奏形式 ,分为四手联弹和双钢琴两种。莫扎特时代这种演奏形式开始走向音乐会舞台 ,随后很多作曲家都专门创作了钢琴二重奏作品 ,
期刊
对优秀田径运动员的选材问题进行了探索性研究,分析了优秀田径运动员选材时应考虑的内容和因素,并针对性地提出了选材的指标要求。
培养学生的综合职业能力是高职教育的目标和特色,它包含职业能力和综合素质两个方面。应加快推行高职英语课程体系改革,通过实行课程模块化教学、改革和创新教学模式,完善和
基于对通过"天球理论"所推导出的太阳方位角与经纬度、时间等参量关系曲线特征的分析,提出了太阳方位角的求解条件,并最终确定了求解公式。经过检验,证明该公式能够真实反映
通过分析变速变桨距风力发电机模型,利用最小二乘法对风力机采样数据进行曲面拟合,并对拟合曲面进行线性化求解,设计出一种辨识分析风力发电机风能利用系数的方法。通过理论
目的:探讨非体外冠状动脉搭桥术(OPCAB)治疗高龄冠心病患者的临床效果。方法:采用OPCAB治疗高龄冠心病患者48例,作为研究组,同时选取以往采用体外循环冠状动脉搭桥术(CABG)治
目的:探讨利用非体外冠状动脉搭桥术治疗高龄冠心病患者的疗效。方法选取高龄冠心病患者60例,采用随机分层法分为治疗组和对照组,每组各30例,治疗组在采取非体外循环冠状动脉搭桥
目的:观察无创正压通气(NIPPV)治疗老年重症急性心源性肺水肿(SACPE)的临床疗效。方法:38例老年SACPE患者(心功能NYHAⅢ~Ⅳ级)随机分两组,对照组17例,采用常规治疗;治疗组21例,在常规
阴影是荣格分析心理学中集体无意识的原型之一,阴影有着丰富的内涵,对人格的发展既有积极的方面,也有消极的一面。认识、接受并整合阴影,深刻理解阴影与人格面具的关系都将使