论文部分内容阅读
在推荐系统运作过程中,新用户(user)和新项目(item)会源源不断涌现。因为缺乏历史信息,传统推荐算法无法直接对新用户或新项目产生有效的建议,这种挑战被称作冷启动推荐问题。冷启动问题可以分为三种场景:用户冷启动——为新用户推荐已存在的项目;项目冷启动——为已存在的用户推荐新项目;系统冷启动——将新项目推荐给新用户。为解决冷启动问题,一种有效的手段是利用用户属性(例如:性别、职业和年龄)和项目属性(例如:类别和厂家)等辅助信息。本文针对基于属性的冷启动推荐问题,提出以下4种推荐模型:针对属性度量函数的适应性问题,提出一种基于属性度量学习的冷启动推荐模型(MetricRec),用以解决用户冷启动。考虑到具有相似属性的用户会表现出相似的兴趣(例如女性会购买化妆品),提出根据属性信息寻找兴趣相似的用户。为解决传统相似函数(例如余弦相似度和Jaccard相似度)的适应性问题,提出MetricRec模型,学习一种通用的相似度函数使得具有相似兴趣的用户在属性空间尽量靠近。为快速优化MetricRec模型,提出基于内点法的随机梯度下降优化方法(ISGD)。ISGD在迭代过程中能够自适应的调整学习率使得参数在可行域内迭代更新。在两个电影评分数据集上的实验结果表明,MetricRec能有效处理用户冷启动问题,并获得优于余弦相似度和Jaccard相似度的度量函数。针对属性与隐特征的映射问题,提出基于属性的N维马尔可夫随机场先验约束的矩阵分解模型(MRF-MF),用以解决三种冷启动。MRF-MF通过随机场约束,使得具有相似属性的用户/项目具有相似的隐特征。根据马尔可夫性,新用户/项目可以采用属性空间的近邻用户/项目的隐特征作为他们隐特征的近似。采用轮换最小二乘法对MRF-MF进行优化,并分析相应的时间复杂度。在两个电影评分数据集上的实验结果表明,MRF-MF具有很好的稳定性,能够在一次训练之后同时有效处理三种冷启动问题。基于同属性用户/项目表现出相似行为的观察,提出属性隐特征学习模型(LPA),用以解决三种冷启动。LPA将隐特征分为两部分:属性隐特征和个性隐特征。属性隐特征表征了具有该属性的一类用户的偏好,个性隐特征刻画了用户与同属性用户之间的差异。类似的,项目隐特征也由属性隐特征和个性隐特征组成。在冷启动场景中,虽然无法获取新用户/项目的个性隐特征,但可以根据属性隐特征做出有效的推荐。采用分块坐标下降算法对LPA进行优化,并分析了优化算法的时间复杂度。实验结果表明,通过适当调整属性隐特征和个性隐特征在模型中的比重,LPA能够在三种冷启动场景中分别获得较高的性能。与MRF-MF相比,LPA在非常稀疏的数据集Bookcrossing上也能获得较好的结果。针对LPA模型参数过多的问题,提出一种基于属性的多级偏好回归模型(MPR),用以解决三种冷启动。MPR将用户对项目的评分看做三种相关性的叠加:1)用户属性与项目属性的相关性;2)用户个体与项目属性的相关性;3)用户属性与项目个体的相关性。与前三个模型相比,MPR是一个线性回归模型,具有全局最优解。但是解析解的时间复杂度过高,为此采用轮换最小二乘法对MPR迭代优化。此外,还分析了 MPR与LPA的内在联系和优缺点。在Movielens和Bookcrossing数据集上的实验结果表明MPR能够获得比LPA更优越的性能。最后总结以上四种模型之间的联系、优缺点和适用性,并基于这些分析总结了几种可行的扩展方案。