论文部分内容阅读
随着信息技术和“5G时代”的快速发展,“信息过载”给人们生活造成巨大困扰。与此同时,随着社交网络和电商平台的迅速崛起,产生了大量的用户行为数据,面对如此丰富的用户数据,许多推荐模型只考虑了用户对项目的评分数据或项目描述内容而忽略了海量的用户关于项目的文本评论信息。另外,推荐系统还普遍存在推荐精度不高、推荐模型扩展性不强等问题。本文通过对大量的文献和资料进行研究与总结,针对目前推荐系统存在的上述问题,提出改进矩阵分解与跨通道CNN结合的推荐模型(MF&跨通道CNN)。该模型将跨通道CNN与基于模型的协同过滤推荐进行结合,充分利用用户评分和文本评论信息获得用户喜好从而提高模型的扩展性和推荐精度。具体地,本文主要做了以下研究工作:(1)从互联网快速发展和“信息过载”的角度分析了推荐技术的研究背景和意义,针对目前推荐系统遇到的问题,本文对传统的推荐算法、基于深度学习的推荐算法、适用领域和优缺点进行了研究,并分析出这两种类别的推荐算法的优势和劣势,为本文模型的提出做准备。(2)基于矩阵分解和深度学习技术,对Kim等人在2016年提出的卷积矩阵分解(ConvMF)模型进行改进。第一,在概率矩阵分解基础上加入用户和项目的偏执,旨在提高模型的扩展性;第二,使用跨通道CNN替代传统CNN;第三,神经网络不是对项目简介进行识别而是对用户文本评论进行特征学习,获取用户对项目的偏好。将改进矩阵分解与跨通道CNN进行结合,充分利用用户评分和用户评论数据,从而提高模型推荐精度。(3)对本文实验数据进行预处理,通过用户评分构建用户评分矩阵,通过TFIDF(Term Frequency-Inverse Document Frequency,TF-IDF)方法构建用户评论的词向量,并对预处理和模型中的超参数进行设置。最后,本文对提出的改进矩阵分解与跨通道CNN结合的推荐模型在MovieLens1M、MovieLens 10M、AIV三个数据集上从两个方面进行实验设计与分析。第一,参数的选取对模型的影响;第二,将MF&跨通道CNN与常用的推荐模型预测效果进行对比分析。实验结果表明:MF&跨通道CNN模型中,当用户和项目正则化系数分别取100和10,矩阵分解隐因子个数K取200,卷积核个数取300时,模型的整体预测效果最佳。MF&跨通道CNN模型与PMF相比,在上述三个数据集上预测效果分别提升4.80%、12.03%和2.34%;与CTR相比,分别提升7.33%、10.14%和6.62%;与ConvMF相比,分别提升0.41%、2.84%和0.66%。随着同一个数据集中训练数据密度的增大,MF&跨通道CNN模型的预测效果也进一步提高。