论文部分内容阅读
随着互联网的飞速发展、智能手机的广泛普及、通信基础设施的逐步完善,电子商务已经成为人们生活中不可或缺的组成部分,从各种电商网站的兴起以及每年的大型促销活动可以看出电子商务中潜藏的巨大潜力。但是与日俱增的不仅仅是用户数,各种各样品质不一价格不一的商品也充斥着整个电子商务领域。这就导致了面对海量的商品,用户不得不花费大量的时间和精力来选择适合自己的商品。如何从成千上万的商品中快速找出用户感兴趣的商品,已经成为学术界和工业界的一个重要研究方向,而电子商务中推荐系统的应用就是解决这一问题的重要途径。根据以往学者和业界对个性化推荐系统的研究,本文以电子商务平台为研究对象,尝试提出相应的改进算法以提升平台的用户体验以及商业价值。首先利用文献调研法对推荐系统的起源和发展进行归纳总结,并对推荐系统领域常用的算法进行了较为全面的介绍。在传统协同过滤算法基础上,提出了基于网络稀疏度的融合时间属性和标签信息的协同过滤推荐算法,并通过离线实验和在线实验对改进的算法进行测评,实验表明该算法相对于原有算法点击率有5.2%的提升。同时,将Wide&Deep模型应用于电子商务领域,设计并实现了基于TensorFlow的Wide&Deep模型,在线实验点击率提升8.3%。主要研究贡献体现在:(1)提出了推荐系统在工业界中的通用框架,将推荐系统分为四个模块:Match阶段、Rank阶段、ReRank阶段、展示阶段。其中,最核心的两个模块为Match阶段和Rank阶段,通常所提的推荐算法都是应用在这两个模块中。该框架的提出可以让我们清晰地了解推荐系统的各个部分是如何工作的,便于加深对推荐系统的理解。(2)对个性化推荐技术进行了较为完整的概述,分别针对Match阶段和Rank阶段的算法进行介绍。Match算法部分,介绍了传统的协同过滤算法,并且介绍了基于图的链接预测(Link Prediction)算法。Rank算法部分,介绍了推荐系统中常用的几种模型,包括线性模型(逻辑回归模型LR)、非线性模型(GBDT)和深度学习模型(深度神经网络DNN、循环神经网络RNN等)。同时指出了目前常用算法存在的问题以及本文提出的改进算法的优势。(3)提出了一种Match算法的改进,通过调整网络稀疏度、融合时间属性、引入标签信息解决置信度低的问题、使用分层i2i及同时进行横向和纵向归一化等改进方法,使得该算法可以适用于大规模推荐的应用场景,同时又能够保证推荐结果的多样性和准确性。(4)将Wide&Deep模型应用于电子商务推荐系统中的Rank阶段,详细介绍了特征工程方面的工作,给出了多维度构造交叉统计类特征的方法。总结了该推荐系统的体系结构,从样本的生成、模型的训练、在线服务三部分进行了详细的论述。该模型综合了逻辑回归模型和深度神经网络模型的优势,保证了模型的“记忆能力”和“泛化能力”。