基于分布式计算的新型协同过滤算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:guizhuyijie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅猛发展,各种信息铺天盖地的呈现在我们面前,在这些海量信息中检索出自己感兴趣的信息越来越难,出现了所谓的“信息超载”现象。个性化推荐技术是解决这个问题的有效途径,它可以通过分析用户的历史信息来建立模型,为用户推荐其感兴趣的产品。在个性化推荐的研究领域中,协同过滤算法是最成熟,也是应用最广泛的一种技术。伴随着推荐系统中用户数目和产品数目的不断增加,现有的协同过滤算法在实践中暴露出了不少问题。本文主要针对协同过滤算法展开了深入细致的分析和探讨,主要研究内容如下:经过分析研究后,发现基于项目的协同过滤算法,尤其是Slope One算法,不仅易于实现,效率高,并且算法具有较高的推荐准确度,不足的是在处理用户间关系的个性化推荐时表现不是很好。为了获得更好推荐效果,本文提出了一种新型的基于项目和用户相似性的协同过滤算法。该算法的核心思想是将用户间的相似性和Slope One算法巧妙的结合起来,首先,计算出用户间的平均相似性,然后,将用户间平均相似性作为Slope One算法的权值计算预测评分。最后,根据预测所得评分值为用户给出推荐。为了解决海量数据时计算复杂度的问题,本文还采用了分布式计算的方式,在Hadoop平台下利用MapReduce编程模型实现了该新型协同过滤算法。在标准的MovieLens数据集上对算法作了多次验证,实验结果表明本文提出的基于项目和用户相似性的协同过滤算法可以有效提高个性化推荐系统的推荐准确度,更适用于当今的社会型网络。
其他文献
评论文本的观点挖掘是指通过对评论文本中的观点、立场等主观信息进行挖掘与分析,判断评论文本中观点的情感倾向性。随着评论文本在人们生活中的广泛应用,仅仅挖掘评论文本的
随着移动终端设备的发展,一种新兴的医疗保健模式移动医疗迅速发展。未来,移动医疗发展潜力巨大。本课题设计实现了面向云平台的心电交互系统。系统包括数据采集端,心电监测
近年来随着移动互联网的兴起,市场上出现了越来越多的嵌入式解决方案,包括手机解决方案、IPTV解决方案、安防监控解决方案等等。不同厂家都推出带有自身特色的解决方案,配套各自
数据挖掘是当今计算机科学中快速发展的一个研究方向,它涉及到多个领域的知识。数据挖掘能从大量的数据中发现一些人们事先未知的、潜在的、有趣的知识,因此广泛被应用于商业分
抠图是一种精确提取任意图像或视频中前景物体的图像处理技术。该技术最早可以追溯到19世纪50年代的光学抠图,现在随着计算机工业的迅猛发展,数字抠图取代了传统的光学抠图并
多智能体系统的分布式协同控制有着十分广泛的工程应用前景,在工业和军事领域中,广泛存在着多智能体系统的协同控制,比如无人驾驶飞行器、无人驾驶车辆的合作控制、无人车的
近年来,随着物联网等新概念的提出和计算机技术的进步,嵌入式系统正以前所未有的速度发展,各种新型的嵌入式设备不断涌现;而且这些新出现的设备对智能化和实时性的要求越来越
研究发现,存储系统中有高达60%的数据是重复的,大量重复数据的存在不仅浪费了存储空间,而且给数据的处理速度和计算的准确性带来很大挑战。近年来,重复数据删除技术逐渐成为研
随着社会信息化进程加快和计算机识别等技术的迅速发展,如何创建更具有真实感的三维人脸模型成为了一个非常具有挑战性的问题。三维人脸模型的重建在虚拟现实、视频监控、三
位置采集技术的日益普及(如GP书,GSM网络等)促进了我们对空间-时间数据的大规模采集,从而为发现珍贵的关于用户移动位置的信息带来了新的机遇。首先,这些大量的空间-时间信息