论文部分内容阅读
推荐系统是一种有效的数据挖掘手段,主要用于帮助用户在海量的信息中快速寻找有用信息。个性化推荐技术常用的三种算法有:基于内容的推荐算法、基于协同过滤的推荐算法以及两者混合的算法。其中,协同过滤技术是目前推荐系统中应用最成功也是最广泛的技术,在理论研究和实践中都取得了快速的发展。协同过滤技术是一种典型的利用群体智慧的方法,借鉴与目标用户有相似观点的人群的意见进行推荐。然而,传统的协同过滤方法正面临着数据稀疏、用户相似性难以度量等问题的挑战,这些问题严重地影响了推荐系统的质量。因此,本文针对上述问题,对协同过滤方法进行了相应的改进,主要工作如下:(1)提出了一种改进的杰卡德统一算子(IJac UOD)相似度测量的方法。最近邻的确定是协同过滤推荐方法中的关键步骤,一般需要通过度量两个用户或者两个项目的相似度来确定,因此选择合适的相似度计算方法对于协同过滤推荐来说至关重要。为了有效地选择最近邻,我们提出了一种改进的杰卡德统一算子(IJac UOD)相似度测量方法,与传统的余弦(Cos)相似度策略、皮尔逊(Pearson)相关策略相比,该方法妥善地解决了不同长度向量差异对相似度的影响。(2)提出了一种基于变权重均值填充的协同过滤算法。该方法首先利用用户-项目评分矩阵中各个项目的平均分对评分矩阵进行插值处理,从而提高了评分矩阵的数据密度,得到一个没有缺失值的用户-项目评分矩阵,而后利用变权重相似度策略计算用户之间的相似度,寻找目标用户的最近邻居集合,最后对通过邻居集中的用户评分对目标用户没有评价过的项目进行评分预测。(3)提出了一种基于SVD插值的变权重协同过滤算法。该方法首先利用奇异值分解(SVD)策略对原始用户-项目评分矩阵进行填充,从而提高了评分矩阵的数据密度,得到一个没有缺失值的用户-项目评分矩阵,而后利用变权重相似度策略计算用户之间的相似度,寻找目标用户的最近邻居集合,最后通过邻居集内用户的评分对目标用户没有评价过的项目进行评分预测。