基于随机游走的推荐技术研究及应用

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:lowner
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,“信息过载”成为用户使用互联网获取信息时所面临的一个重要问题。虽然借助于信息检索技术,可以从一定程度上得到缓解,在面对海量的信息时,用户仍然还会迷失方向,甚至不知道自己真正需要的是什么。由此,个性化推荐技术应运而生,它能够有效地处理这类问题。本文回顾了推荐系统的相关算法,并重点研究随机游走方法在个性化推荐中的应用。本文介绍几种经典的、已经在商业领域得到广泛应用的邻域算法。由于数据的稀疏性是协同过滤系统存在的一个重要问题,为此本文分析了稀疏性的成因、表现,稀疏性对推荐精度的影响,以及相关的解决办法,并着重介绍一种基于随机游走的算法SimRank及其改进形式SimRank++。 SimRank++算法基于相似性具有传递性的假设,建立对象之间的关联关系,实验分析发现SimRank++直接应用于推荐系统中的效果差强人意,本文对其做进一步改进。为了能够实现个性化推荐,我们将主题敏感的PageRank算法应用于用户一物品二分图,将每个用户看作一个主题,产生一种新的图模型算法:个性化的PageRank (Personalized PageRank, PPageRank).本文还给出PPageRank算法的收敛性证明,并建立邻域算法同图模型算法关系,最后将SimRank++改进算法的加权思想融入到PPageRank中并提出一种加权形式的PPageRank算法:WPPageRank。本文使用基于用户的协同过滤推荐算法(UserCF)与基于物品的协同过滤算法(ItemCF)作为基准算法,在标准的MovieLens数据集上进行对比试验,结果表明本文提出的WPPageRank算法和改进的SimRank++算法的推荐效果最佳。
其他文献
区间数理论作为处理不确定性数学理论基础之一,已被广泛应用于工程技术和管理决策等诸多领域中。在模糊聚类、不确定多属性理想决策等实际问题中,两个区间向量间的度量起着关键
[3.3.3.3.6]铺砌和[3.6.3.6]铺砌均是由正三角形和正六边形生成的阿基米德双铺砌.  本文第一章讨论的是阿基米德双铺砌[3.3.3.3.6]中有限子图的哈密顿性.首先在铺砌图[3.3.
设P为平面中的有限点集,如果P的任意k元子集(k≥3)中存在一个点到另外两个点的距离相等,则称P为k-等腰集.  1998年,P.Fishburn对k=4的情形进行了研究,给出了4-等腰集的部分结果。
本文对比了智能家居中的总线技术,并介绍了在智能家居中如何选用高性价比产品,及灯光控制、窗帘控制、背景音乐控制、空调控制等设备技术参数;安全防范接入及实现,以及利用RS
Based on the similarity theory,a tunnel excavation simulation testing system under typical unsymmetrical loading conditions was established.Using this system,th
本文的主要工作是构造了求解理想磁流体动力学(MHD)方程组的全局散度为零的间断有限元(DG)方法,和构造了对标量守恒律满足极大值原理的任意拉格朗日欧拉间断有限元(ALE-DG)方
作为近代泛函分析的一个十分重要的分支,Banach空间几何理论在现代数学课题研究中极具意义与研究价值。Orlicz空间是一种特殊的Banach空间。由于其生成函数的多种多样,Orlicz空间也是千姿百态,性格迥异的。而这一特点使得它能够为比较抽象的Banach空间提供充足的实例和反例,并且Orlicz空间在其几何性质上的刻画技巧与方法可以为解决更一般空间的几何问题提供参考思路。由于Orlicz空间
学位
随着现在科学技术的进步与发展,离散数学中的图论,超图,组合设计,编码设计等领域的研究内容越来越丰富。超图作为离散数学中最一般的结构,对它的研究也有重要的意义。本文在Katona
正交阵列是组合设计理论与试验设计理论所研究的重要课题之一.正交阵列是统计学家C.R.Rao在1947年引入的一种用来解决正交试验设计的组合结构.在此之后,许多组合数学家和统计
本文主要结果由两部分构成.  第一部分,研究渐近柱状K(a)hler流形上的Higgs丛假设D为紧致的K(a)hler流形,V是以D为渐近横截面的渐近柱状K(a)hler流形,(ED,θD)是D上稳定的Higgs丛