论文部分内容阅读
近年来,在“互联网+”浪潮下,各行业用数据赋能,增强企业竞争力。在兴起的O2O浪潮中,各类商户拥有丰富的线上线下用户数据,将这些数据加以利用,可以增强商户竞争力,提升用户体验。通过电子优惠券吸引用户是O2O行业性价比最高最有效的营销手段之一,但是海投电子优惠券核销率极低,严重影响营销效果,同时也对商户营销预算提出挑战。如果通过提前预测用户使用结果,为目标用户投放合适的优惠券,可以提高优惠券核销,提升营销效果和用户体验。应用数据工程技术对电子优惠券投放效果进行预测,可以优化投放,提升优惠券核销。在电子商务领域预测任务中,特征工程和算法是不可或缺的部分,是预测成功的关键。目前已经提出和研究了上千种分类算法,但是没有太多讨论O2O优惠券领域特征工程的内容。本文主要研究内容如下:1.为丰富数据信息量,提升预测效果,进行特征构建和选择。本文根据原始数据构建大量特征,并根据特征类型进行分组,通过特征组对结果的影响评估其重要性,进行特征选择。2.为进一步提升预测效果,进行多模型融合。单模型预测中,各类算法各有所长,通过多模型融合,充分发挥各算法的优势,提升预测效果。3.以上述特征工程和多模型融合方法为核心,设计和实现O2O优惠券个性化投放系统。本文数据来源于天池O2O优惠券使用预测大赛提供的基于口碑用户真实线上线下消费数据,评价标准是优惠券核销预测的平均AUC值(AUC值即ROC曲线下面积,AUC值越高预测性能越好)。本文通过特征构建和选择,将AUC值提升到0.80728,通过多模型融合,AUC值进一步提升到0.81120,预测效果提升明显。目前在优惠券核销预测AUC值排行榜上的13329支队伍中排名第二。本文基于以上核心方法,设计和实现了O2O优惠券个性化投放系统,真正实现“投其所好”,提升优惠券核销,增强了商户竞争力和用户体验。