论文部分内容阅读
随着互联网技术的发展,推荐系统被应用在越来越多的场景来缓解信息爆炸的时代用户信息过载的问题,一个好的推荐系统可以大量减少用户在寻找所需信息过程中花费的人力和时间,提高用户的体验感,为企业创造利润。因此,如何提高推荐系统性能,快速的在大量信息中筛选出用户的所需信息成为了时下一个炙手可热的研究课题。经过多年的发展,传统的简单推荐模型已经不能满足用户日渐丰富的信息,越来越多的研究尝试将深度学习用于推荐系统领域来实现推荐系统的智能化。本文针对推荐系统相关算法进行研究和应用,尝试将梯度提升决策树GBDT(Gradient Boosting Decision Tree)以及深度学习模型 WDL(Wide and Deep Learning)相结合,来实现一种可以实现自动化特征交叉的组合模型GWDL,并引入堆栈去噪自编码器SDAE(Stacked Denoised Autoencoder)技术。基于以上基础,本文研究并实现了混合推荐算法SDAE-GWDL,旨在提高原基础模型WDL各方面的性能,并将混合模型实际应用在电影推荐场景,来验证改进后模型的可用性。为了达到以上目标,本文主要研究工作如下:1.对WDL模型的特征工程部分进行研究,提出将GBDT决策树和WDL模型结合,从而解决深度学习模型WDL中需要手工特征交叉的问题,提高模型挖掘用户高阶特征的能力。2.对模型输出层部分进行研究,改进模型输入层的设计。3.对堆栈去噪自编码器进行研究,针对实际推荐场景中特征数据稀疏的问题,提出将SDAE与上述GWDL模型相结合,旨在提高模型推荐结果的准确度和去噪能力,并改善模型的冷启动性能。本文通过在三个推荐模型训练常用数据集(Movielens数据集、Lastfm数据集和Jester数据集)上进行模型的性能测试实验,采取Precision、AUC(Area Under the Curve)、Recall作为实验的评测指标,将三个数据集上上述评测指标的平均值对新模型的性能进行评测,实验结果表明,基础模型的Precision、AUC、Recall分别为0.7397、0.8401、0.5591,改进后模型的指标值分别为0.7626、0.8777、0.5934,三个指标均有不同程度的提升,验证了该算法模型在推荐方面的性能提升。此外,本文还评测指标mAP(mean average precision)对模型的冷启动性能进行了评测,结果表明改进模型的mAP在原模型的基础上平均提升了 2.45%。本文研究并提出的SDAE-GWDL算法模型可以提升推荐结果的准确度,改善推荐系统的冷启动性能。基于以上对推荐模型的研究,本文设计并实现了基于Django平台和改进后融合模型的个性化电影推荐系统。该系统实现了高效的个性化电影推荐功能,并且经实验验证融合模型的加入可以提高推荐结果的准确性以及改善推荐系统的冷启动性能。