论文部分内容阅读
当今社会,每个人的身边充斥着大量的信息,尤其是互联网中,海量的信息几乎包含了人们所需要的全部内容,但是“信息过载”问题仍使人们难以找到他们真正需要的东西。“搜索引擎”的出现在很大程度上解决了“信息过载”问题,但是搜索引擎对每个用户提供的都是相同的服务,因此,人们渴望获得更具针对性的个性化的服务。在这种情况下,推荐系统应运而生,它能够给用户提供个性化的信息推荐服务。20世纪90年代人们开始研究推荐系统,出现了大量关于推荐系统的研究成果,提出了许多种推荐算法,这些推荐算法应用在网页浏览、电影推荐、音乐推荐与电子商务等方面。目前,推荐系统也有了很多成功应用的案例,推荐系统为商家和用户都创造了有用的价值。本文的主要工作如下:1.全面介绍了推荐系统的研究背景与研究现状。并介绍了几大类推荐系统,包括基于内容的推荐、基于知识的推荐、协同过滤推荐、基于图结构的推荐和组合推荐,特别是对协同过滤推荐做了较为详细的阐释。2.详细分析了基于矩阵分解的协同过滤推荐算法,对矩阵分解所采用的梯度下降法做了简介,给出了基本矩阵分解Basic MF(Basic Matrix Factorization)、规范化矩阵分解Regularized MF(Regularized Matrix Factorization)和偏差矩阵分解Biases MF(BiasesMatrix Factorization)的整个流程。对矩阵分解所采用的差异度量方法做了讨论,介绍了不同于一般情况的采用KL散度(Kullback-Leibler Divergence)刻画部分差异的KLDDMF(Kullback-Leibler Divergence and Difference Matrix Factorization)算法。3.为了提高矩阵分解算法的预测精确度,本文提出了几种新的矩阵分解算法,它们是偏差向量矩阵分解BV MF(Biases Vector Matrix Factorization)、用户相似性矩阵分解US MF(Users Similar Matrix Factorization)、项目相似性矩阵分解IS MF(Items SimilarMatrix Factorization)和用户相似性项目相似性矩阵分解USIS MF(Users Similar and ItemsSimilar Matrix Factorization),其中,US MF与IS MF是USIS MF的两种减弱模型。BVMF将用户和项目的偏差扩展到每个特征,每个特征都会有特定的用户偏差和特定的项目偏差,相比于其它模型BVMF的变量要更多。由于矩阵分解后的用户向量和项目向量可能不会保持原始的用户之间与项目之间的相似性关系,这样就丢掉了内在的相似性重要关系,在US MF、IS MF和USIS MF中结合了用户或项目的相似性关系,将相似性信息融入到最小化的目标函数中,挖掘更深层的潜在信息,以使预测结果更为精确,US MF只考虑用户相似性信息,IS MF只考虑项目相似性信息,USIS MF是它们的结合,同时考虑了用户与项目的相似性信息。BVMF在预测精确度方面没有如预计的那样有好的表现;US MF和IS MF在精确度方面相比于Basic MF与Regularized MF都有了提高,但它们比BiasesMF要差;USISMF是表现最优秀的,在精确度方面,相比于BiasesMF它依旧有较大提高。4.对矩阵分解算法的预测评分方法做了讨论,包括直接预测(Direct Prediction)、近邻预测(NearNeighbors Prediction)等,针对预测评分超过评分上下限的问题,提出了一种新的预测方法——映射预测(MappingPrediction),它把预测评分映射到评分上下限以内,并且保持了预测评分的相对高低状况,这样处理过的预测评分就不存在超过评分上下限的不合理情况,经过映射预测的评分在预测结果上有了一定的改善。5.介绍了几种不同的推荐算法评测标准,包括MAE(Mean Absolute Error)、RMSE(RootMeanSquareError)、查准率(Precision)、查全率(Recall)。并提出了一种新的评测指标——正确率(Accuracy)。正确率是在对预测评分进行四舍五入的基础上对推荐算法做出评价,它不像查准率与查全率只考虑推荐给用户的项目的正确概率,还考虑了那些不能推荐给用户的项目的预测准确度。6.在数据集上做了大量实验,分析各种推荐算法的运行结果。本文针对预测精确度问题提出了几种新的算法,BVMF、USMF、ISMF和USISMF,其中,除BVMF以外,它们在精确度方面都有提高。对于评分的预测,提出了一种新的映射预测方法,相比于直接预测有很明显的效果。在评测方面,给出了一种新的正确率评测指标,它在一定程度上可以衡量算法的优劣。