基于矩阵分解的协同过滤推荐算法研究

被引量 : 0次 | 上传用户:aiming5968f
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会,每个人的身边充斥着大量的信息,尤其是互联网中,海量的信息几乎包含了人们所需要的全部内容,但是“信息过载”问题仍使人们难以找到他们真正需要的东西。“搜索引擎”的出现在很大程度上解决了“信息过载”问题,但是搜索引擎对每个用户提供的都是相同的服务,因此,人们渴望获得更具针对性的个性化的服务。在这种情况下,推荐系统应运而生,它能够给用户提供个性化的信息推荐服务。20世纪90年代人们开始研究推荐系统,出现了大量关于推荐系统的研究成果,提出了许多种推荐算法,这些推荐算法应用在网页浏览、电影推荐、音乐推荐与电子商务等方面。目前,推荐系统也有了很多成功应用的案例,推荐系统为商家和用户都创造了有用的价值。本文的主要工作如下:1.全面介绍了推荐系统的研究背景与研究现状。并介绍了几大类推荐系统,包括基于内容的推荐、基于知识的推荐、协同过滤推荐、基于图结构的推荐和组合推荐,特别是对协同过滤推荐做了较为详细的阐释。2.详细分析了基于矩阵分解的协同过滤推荐算法,对矩阵分解所采用的梯度下降法做了简介,给出了基本矩阵分解Basic MF(Basic Matrix Factorization)、规范化矩阵分解Regularized MF(Regularized Matrix Factorization)和偏差矩阵分解Biases MF(BiasesMatrix Factorization)的整个流程。对矩阵分解所采用的差异度量方法做了讨论,介绍了不同于一般情况的采用KL散度(Kullback-Leibler Divergence)刻画部分差异的KLDDMF(Kullback-Leibler Divergence and Difference Matrix Factorization)算法。3.为了提高矩阵分解算法的预测精确度,本文提出了几种新的矩阵分解算法,它们是偏差向量矩阵分解BV MF(Biases Vector Matrix Factorization)、用户相似性矩阵分解US MF(Users Similar Matrix Factorization)、项目相似性矩阵分解IS MF(Items SimilarMatrix Factorization)和用户相似性项目相似性矩阵分解USIS MF(Users Similar and ItemsSimilar Matrix Factorization),其中,US MF与IS MF是USIS MF的两种减弱模型。BVMF将用户和项目的偏差扩展到每个特征,每个特征都会有特定的用户偏差和特定的项目偏差,相比于其它模型BVMF的变量要更多。由于矩阵分解后的用户向量和项目向量可能不会保持原始的用户之间与项目之间的相似性关系,这样就丢掉了内在的相似性重要关系,在US MF、IS MF和USIS MF中结合了用户或项目的相似性关系,将相似性信息融入到最小化的目标函数中,挖掘更深层的潜在信息,以使预测结果更为精确,US MF只考虑用户相似性信息,IS MF只考虑项目相似性信息,USIS MF是它们的结合,同时考虑了用户与项目的相似性信息。BVMF在预测精确度方面没有如预计的那样有好的表现;US MF和IS MF在精确度方面相比于Basic MF与Regularized MF都有了提高,但它们比BiasesMF要差;USISMF是表现最优秀的,在精确度方面,相比于BiasesMF它依旧有较大提高。4.对矩阵分解算法的预测评分方法做了讨论,包括直接预测(Direct Prediction)、近邻预测(NearNeighbors Prediction)等,针对预测评分超过评分上下限的问题,提出了一种新的预测方法——映射预测(MappingPrediction),它把预测评分映射到评分上下限以内,并且保持了预测评分的相对高低状况,这样处理过的预测评分就不存在超过评分上下限的不合理情况,经过映射预测的评分在预测结果上有了一定的改善。5.介绍了几种不同的推荐算法评测标准,包括MAE(Mean Absolute Error)、RMSE(RootMeanSquareError)、查准率(Precision)、查全率(Recall)。并提出了一种新的评测指标——正确率(Accuracy)。正确率是在对预测评分进行四舍五入的基础上对推荐算法做出评价,它不像查准率与查全率只考虑推荐给用户的项目的正确概率,还考虑了那些不能推荐给用户的项目的预测准确度。6.在数据集上做了大量实验,分析各种推荐算法的运行结果。本文针对预测精确度问题提出了几种新的算法,BVMF、USMF、ISMF和USISMF,其中,除BVMF以外,它们在精确度方面都有提高。对于评分的预测,提出了一种新的映射预测方法,相比于直接预测有很明显的效果。在评测方面,给出了一种新的正确率评测指标,它在一定程度上可以衡量算法的优劣。
其他文献
随着高新技术的快速发展,雷达技术不断进步,应用范围愈加广泛,从气象预报到资源探测,从军事预警到天体研究,从航空导航到船舶导航,雷达技术扮演着重要角色。通过对雷达回波的
以宽带网络为基础,用IPTV机顶盒加上电视,用户就可以完成包括电视直播、视频点播、时移电视、网络浏览、信息服务、互动游戏,以及未来可扩充的业务。与此同时,人们对高质量高
目的:血凝素样氧化型低密度脂蛋白受体-1(Lectin-like Oxidized LowDensity Lipoprotein Receptor-1,LOX-1)是氧化低密度脂蛋白(OxidizedLow Density Lipoprotein,ox-LDL)的主要受体
<正>一、农村初中化学后进生学习化学困难成因2012年3月23日我们采取抽样调查的方法对我校学生学习化学困难原因进行调查。要据学校的实际情况,在全校整个九年级7个班中抽取4
随着国家经济的高速发展,汽车、公交车等交通运输工具在中国越来越普遍,这也推动了汽柴油在中国的需求大增。而汽柴油的质量问题不仅是消费者极为关心的问题,更应该得到国家,
集装箱班轮舱位分配问题是班轮企业收益管理的核心内容,现已成为各大院校和企业的研究课题。随着班轮企业的发展,竞争日益激烈,运价的增长空间已经非常有限,贸易不平衡导致的
目的:(1)了解痰标本肉眼性状、涂片镜检及培养结果间的相关性,探讨痰培养标本验收方法。(2)探讨痰培养对下呼吸道感染诊断与治疗的指导意义。方法:(1)将某院2011年10月份临床送检的457
日语作为一种发展迅速的语言,它灵活的词性变换方式一直是日语学习者研究的重点。近几年,日本年轻人用语作为日语的一部分迅速发展,备受关注。米川明彦曾在《现代若者ことげ
本文主要包括两方面内容,一是采用真空变压吸附(VPSA)的方法安全有效的脱除含氧煤层气中的氧气;二是初步研究适用于含氧煤层气脱氧的炭分子筛(CMS)的制备方法。本文对五种商业炭分
随着世界经济一体化和全球贸易的发展,大宗货物运输日益频繁,航运业由于其运量大、价格低等优点,成为国际货物运输的主要渠道,对国际贸易和国内经济的有着巨大的推动作用,但