基于Voting策略的在线商品购买预测模型

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:miaoym
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着线上经济的日新月异,整个购物时代已经过渡到线上购物时代。在线下的购物中,消费者和商家都是面对面进行交易,商家可以直观看到消费者的购物需求和购物行为。而在线上的购物行为,电商平台只能利用强大的服务器来进行记录和管理,然后从这些海量的用户行为数据中挖掘出相关信息来了解线上消费者的购物倾向,从而预测用户未来的购买行为。所以,如何利用数据挖掘算法和机器学习算法从海量的用户购物行为数据中,挖掘出线上用户的购物倾向,成为当今研究热点。首先,本论文对用户购买行为预测的研究背景、意义和国内外研究现状进行介绍,并且给出了本论文的创新点和整体研究结构框架。其次,介绍了召回阶段的数据挖掘算法的基本理论,并对召回的用户-商品列表进行部分展示。再次,本文选取了阿里云比赛中提供的真实用户购物行为数据(用户信息数据、商品信息数据和用户行为信息数据),根据对其数据的探索性分析和实际的业务背景,以召回的用户-商品列表为提取特征的基础,构造了89个数据特征,接着基于SVM-RFE特征选择算法选择了排名前30的数据特征。在以上分析后,本文选取逻辑回归模型和随机森林算法模型构造用户购买预测模型,并利用Soft Voting算法融合策略对以上两个最优模型进行算法融合,构建成混合模型,进行实证研究。这一过程中,主要的实证研究有:其一,对用户历史购物行为数据进行探索性分析,例如:分析哪种购物行为最能影响未来的用户购买行为、分析购物行为发生的时间是否影响未来的购物行为等,并对原始三个数据进行对应关联。其二,在数据探索分析中发现,用户在过去购物行为所发生的时间对未来的用户购买行为有着显著的影响,所以构造了用户u对商品i在考虑时间因子后的兴趣影响度Ru,i,并添加到数据中。其三,将F1值作为用户购买预测模型的评价指标,并对预测模型超参数进行调优,进行5折交叉验证选择出最优的用户购买预测模型。实证结果显示:基于Soft Voting算法融合策略构造的混合模型在训练集和测试集中的F1值都要高于调优后的单一机器学习算法模型,为最优用户购买预测模型。最后,对本论文的研究过程进行总结,并且对以后的工作进行展望。
其他文献
学位
学位
学位
学位
学位
学位
学位
学位
学位
学位