论文部分内容阅读
随着分布式计算、人工智能、云计算等技术的迅速发展,各类网络服务的应用使数据规模与信息体量呈现指数级增长,推荐系统及其相关技术逐渐成为处理“信息过载”的重要工具。推荐系统需要记录用户交互行为中的显式行为或隐式行为,发掘出用户的偏好特征,然后产生符合用户偏好的物品推荐列表。由于传统的推荐系统主要通过人工或浅层模型提取用户或者物品的特征,因此传统方法难以获取用户或者物品的深层次表达。此外,传统的推荐系统在分析用户的偏好特征时,忽略了用户偏好会因时间而发生动态变化。针对以上问题,本文进行的研究工作如下:首先,本文采用Word2Vec模型对输入序列中的物品进行表征,并使用循环神经网络预测用户下一时刻交互的物品,提出W-LSTM的推荐模型。由于用户的历史行为之间具有上下文关系,可以使用Word2Vec框架对具有前后联系的用户行为进行建模,生成低维、稠密的物品词向量,并获取用户行为之间隐藏的语义关系,使循环神经网络在预测用户下一时刻点击的物品时有更好的表现。其次,在电影推荐任务中,为了使循环神经网络关注用户偏好的流派特征和部分重要的行为,本文构建了基于评分注意力机制并融合流派特征的GE-RA-LSTM模型。为了关注用户偏好的流派信息,模型在输入部分将电影的流派特征与电影词向量拼接。此外,为了关注用户的部分重要行为,模型将评分-逆物品频率与注意力机制相结合,使模型注重用户历史序列中的高分电影和冷门电影,挖掘出用户的独特偏好。GE-RA-LSTM模型不仅实现了挖掘用户的动态偏好,还可以为用户推荐更感兴趣的电影,同时增大了冷门电影的推荐力度。最后,本文将上述模型在Movie Lens-10M数据集中进行验证。实验结果表明,W-LSTM模型由于使用Word2Vec对用户历史序列的电影进行表征,在准确性和覆盖率等推荐指标上比随机初始化电影词向量的模型有一定的提升,并大幅度缩短模型的训练时间;在模型的输入部分引入一定数目的流派个数,可以使推荐的准确性进一步提升;使用评分注意力机制的GE-RA-LSTM模型在覆盖率指标上比使用注意力机制的推荐模型有较大提升。与传统推荐算法相比,本文提出的W-LSTM和GE-RA-LSTM模型都具有更好的推荐效果。综上所述,Word2Vec通过提取用户行为的上下文联系,可以对物品进行更好的表征。如果模型考虑用户偏好流派的影响,可以提升推荐结果的准确性。此外,在模型中引入评分注意力机制,可以使模型关注用户部分重要行为,挖掘用户独特偏好,从而提升推荐性能。