基于云平台的个性化电影推荐算法研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:wuxinghui_1975
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,人们已经从信息匮乏时代进入了大数据时代,和搜索引擎一样,个性化推荐系统也是一种帮助用户在信息过载的情况下快速发现有用信息的工具,它依据用户的特征及历史行为,主动向用户推荐符合其个人偏好的信息内容。协同过滤推荐算法作为个性化推荐系统中最重要的一种方法,已经在实践中取得了广泛的应用。本文首先梳理了最新的推荐系统总体发展趋势,然后总结归纳了主流推荐算法的各自特点、适用范围,重点介绍了新一代大数据处理框架Spark,包括设计机制与原理,为下一步的研究奠定了理论基础与实验基础。针对现行的协同过滤推荐算法所面临的冷启动、可扩展性、用户信任等关键问题,在以下几个方面作了相应的理论研究和应用研究:(1)提出了两种基于矩阵分解的协同过滤算法。为了解决基于传统模型的协同过滤算法的数据稀疏性与冷启动问题,引入权重因子,并结合隐式反馈信息,提出了两种基于奇异值分解(SVD)的协同过滤算法,CSVD算法和NCSVD算法。CSVD算法在基于偏置的矩阵分解模型上引入了权重因子,以调整用户偏置参数与物品偏置参数之间的权重问题,NCSVD在此基础上引入隐式反馈信息,改善了冷启动问题,在真实数据集上的实验证明表明,其能有效提高SVD系列算法的推荐精度。(2)将信任机制引入到上述改进的协同过滤算法中,构建了一种基于信任和矩阵分解的协同过滤算法。结果表明,信任是影响推荐系统的一重要因素,在推荐系统中对其研究是有意义的。(3)针对矩阵分解算法计算量大,训练时间长,难以应用到实际工程中的问题,在大规模分布式机器学习平台Spark上研究矩阵分解推荐算法CSVD的并行化设计及其实现,并对比了CSVD算法在不同平台上的训练时间和算法的加速比,实验证明,基于Spark的CSVD算法训练时间少于其他平台,并有很好的加速比,适用在大规模数据推荐中。
其他文献
课堂考勤是高校教学管理中必不可少的手段之一,而传统“签到”的方式不仅费时费力,而且效率较低。随着移动互联网的发展和4G时代的到来,智能手机已成为人们生活必不可少的一部分
聚类分析的目是将数据自动划分成有意义的分组。不同的聚类算法在相同的数据集上运行会得到不同的结果,没有一种单独的聚类算法能够在所有的数据集上找到最好的划分。聚类集
二十世纪八十年代逻辑程序设计语言在描述性语义上取得突破性的进展-稳定模型语义(回答集语义),为逻辑程序的研究打开了大门。回答集语义的提出使人们可以用逻辑程序表示问题
空间数据的复杂性会导致空间数据处理的延迟,这对实时性要求比较高的应用问题如军事作战等问题产生了巨大的挑战。设计支持空间分析的并行算法是解决此类问题的有效方法,然而
Web服务的出现代表了分布式计算的最新要求。随着应用需要的不断提升,Web服务技术已从基础设施构建与概念推广阶段向大规模商业应用阶段快速发展,从而推动了支持B2B(business
机器人足球比赛目前已成为人工智能应用技术研究的重要实验平台,引起了越来越多的学者的关注。足球机器人系统分为四个子系统——机器人子系统、视觉子系统、决策子系统、通讯
对于传统的RFID系统来说,其阅读器通常是固定的或者使用专用的手持设备,只适用于特定场景。随着移动智能设备的快速普及,配置迅速提升,将移动智能终端与RFID网络的优势结合起
随着信息技术的迅速发展,信息化建设过程中积累了大量有用数据信息。但由于建设时期或开发部门的不同,这些数据资源形成了一座座“信息孤岛”,使得数据的查询和访问非常困难,数据
随着网络的普及,电子邮件与人们的工作生活联系日趋紧密,随之而来的垃圾邮件问题日益严重。在分布式垃圾邮件处理领域,基于Nilsimsa摘要的垃圾邮件识别技术和基于信誉机制的垃圾
图像配准是对不同时间、不同角度所获得的同一场景的多幅图像进行最佳匹配的过程,即将图像对齐后,明确图像空间位置变化与强度变化,然后确定图像序列之间位置映射关系或强度