论文部分内容阅读
准确预测电商产品销量对提高企业进货、发货速度,优化企业产品库存,降低电商供应链运营成本具有重要意义。由于电商产品交易周期短、时效性强,因此销量预测具有明显的小样本数据特征。传统的销量预测方法例如:时间序列、决策树等因样本数据局限,容易出现过拟合问题,进而导致预测效果相对较差。本文将针对小样本数据下的电商产品销量预测问题,系统构建影响电商产品销量的多维因素,在此基础上引入机器学习方法,构建小样本数据下电商产品销量预测模型,并尝试对新产品销量预测开展模型迁移研究。主要研究内容及结论如下: (1)影响电商产品销量的多维指标体系构建。首先,综合考虑企业内部产品库存及采购等信息、产品用户搜索行为、电商产品用户评论等多维因素对产品销量的影响,构建指标体系。其中:重点针对产品评论信息,构建双向LSTM情感分析模型,计算评论情感指数。其次,为降低同类指标间的相关性,将13个原始指标划分为5大类,包括:网络搜索、页面访问、企业内部库存及采购、评论质量、评论情感指数,针对同类指标进行熵值融合,为后续销量预测提供指标基础。 (2)基于集成学习Xgboost的电商产品销量预测模型构建及检验。在小样本数据下,构建基于集成学习Xgboost的电商产品销量预测模型,其中重点利用logistic函数和正则修正项确定目标函数,并利用贪心算法确定每颗预测树的预测层数。通过对A公司ZUK Z2产品数据进行模型检验,并与传统的BP神经网络预测、支持向量机预测、BP-SVM组合预测等方法进行对比,得出Xgboost预测精度最高。 (3)基于样本迁移的电商产品销量预测模型研究。针对小样本数据下的特例,即历史数据匮乏的新产品,构建基于样本迁移的电商产品销量预测模型。参考产品上市周期选择同系列产品作为候选产品集,根据新产品与候选集产品的性能特征确定源域产品。利用最小二乘法和遗传算法对新产品销量向量与源域产品销量向量进行模式匹配,测算优化的模式长度和个数,进而进行电商产品销量预测。以A公司ThinkPad New S2为源域产品针对S3新产品做模型检验,通过销量预测误差证明模型的预测精度可接受。 本文重点构建了影响电商产品销量的多维指标体系,将文本挖掘与集成学习方法结合,解决小样本数据下电商产品销量预测问题。同时针对小样本且指标数据缺失情况下的新产品销量预测,构建迁移学习模型。该研究为电商产品销量预测提供了思路,为电商企业需求决策提供了参考。