论文部分内容阅读
销售预测是企业运营中很重要的一个环节,如果预测结果严重高估或低估了销量,那么就会给企业带来很大的损失。跨境电商的物流成本往往比较高,尤其需要能够及时准确地预估未来的销售。现在随着电子商务的发展和大数据时代的到来,预测销售所需要的数据十分丰富但也更为复杂,同时随着计算机技术的进步,一些复杂的预测方法也能应用于实践,企业对销售预测的要求也变得更高了。时间序列回归、决策树、随机森林都是销量预测的常用方法,但在现在数据集庞大且数据特征复杂的情况下,预测准确性不如现在新提出的一些算法。XGBoost算法是新近提出的一种决策树模型,在大样本数据上表现出了优异的预测效果,现在不仅广泛应用于竞赛中,也广泛应用于产业界。本文利用卡尔曼滤波改进XGBoost算法,构建出误差率更低的组合预测模型,基于某跨境电商在沙特阿拉伯市场积累的快消品销售数据,预测10万多个目标商品未来一周的销售量。通过和没有改进的XGBoost模型、决策树模型、随机森林模型对比实验发现,本文提出的模型的均方根误差降低了70%以上。