论文部分内容阅读
随着互联网的飞速发展,网络信息爆炸式地增长,给网络用户带来了“信息过载”问题。推荐系统通过挖掘用户兴趣为用户进行个性化推荐来缓解这一问题,得到了广泛的研究和应用。已有的研究在分析利用用户对项目的评分数据时,大都默认某个用户给不同项目的打分是分别独立进行的,而不同用户对同一项目的评分也是分别独立进行的。然而,在现实生活中,用户在给一个项目评分时通常不仅会考虑对该项目的评价,而且,更为重要的是,还会将该项目与曾经评价过的其他项目进行对比,或是考虑其他用户对该项目的评价,基于这些比较之后再给出对该项目的评分。也就是说,用户对项目的评分在很大程度上是对比的结果,具有相对性。本文基于建模这种现实现象,把同一用户对不同项目的不同评价,以及同一项目由不同用户得到的不同评价视为竞争关系,创新性地引入概率竞争模型对这些竞争关系进行建模,并由此获得用户兴趣,从而实现个性化推荐。具体而言,本文的主要研究工作和成果包括:提出了一种基于内容竞争关系的推荐模型。该模型通过项目内容竞争关系挖掘用户兴趣。首先,模型假设不同项目之间存在争夺用户兴趣的竞争关系,同一用户对不同项目的评价是不同项目争夺用户兴趣所进行竞争的结果;其次,项目之间的竞争关系体现为描述项目的内容之间的竞争关系,进一步内容之间的竞争关系体现为内容中各个独立特征之间的竞争关系。基于上述假设,采用竞争模型建模内容特征间的竞争关系,从而获得用户对各个特征的兴趣偏好值,这些值就可以用于预测用户对新项目的兴趣。在两个公开数据集上与当前有代表性的推荐方法进行的对比实验结果表明,本模型具有更高的推荐准确度,同时推荐所需的时间也更短。进一步实验表明,本模型的推荐性能随竞争数据规模的增加而不断提高。提出了一种基于二元特征的内容竞争关系推荐模型。该模型在基于内容竞争关系推荐模型的基础上,引入基于同现关系的二元特征作为项目内容的表征,使模型能对更为丰富和复杂的内容竞争关系进行建模,在更细的颗粒度上描述和区分用户兴趣。在两个公开数据集上的实验结果表明,引入二元特征作为内容表征比基于特征间独立的内容竞争关系推荐模型在两种推荐指标下均具有更好的推荐性能。在Netflix数据集上,该模型比基于内容竞争关系的推荐模型在MAE指标上提高了0.9%,在RMSE指标上提高了1.6%。提出了一种基于竞争关系的协同过滤推荐模型。该模型直接在用户评价数据上构造竞争关系,并在协同过滤模型基础上引入该竞争关系。首先,该模型考虑了用户对项目的评价时对比其他用户对该项目的评价,得到用户兴趣之间的竞争关系,从而获得用户对项目的兴趣偏好值;然后,使用同一用户在不同项目上的兴趣偏好值构建用户兴趣向量来表征该用户的兴趣,基于此进行不同用户间的相似性比较,并预测目标用户对新项目的兴趣。在两个公开数据集上与基于用户的协同过滤方法进行的对比实验结果表明,该模型比传统方法具有更高的推荐准确度。进一步实验表明,当同一项目获得多样性的用户评价时,该模型的建模效果更好。提出了一种基于竞争关系的混合推荐模型。在上述分别基于竞争关系对项目内容和用户评价进行建模的基础上,本模型同时建模项目之间和用户兴趣之间两种不同角度的竞争关系,将基于二元特征的内容竞争关系推荐模型与基于竞争关系的协同过滤推荐模型组合生成单一的推荐结果,为用户进行推荐。该模型通过结合这两个具有互补性的模型的结果,缓解了两个模型中各自存在的过专一化问题、冷启动问题和数据稀疏问题。实验结果表明,该模型具有比单一模型更高的推荐准确度。在Netflix数据集上,RMSE指标下,该模型比基于二元特征的内容竞争关系推荐模型提高了13.8%,比基于竞争关系的协同过滤推荐模型提高了9.1%。