论文部分内容阅读
随着物流配送需求的快速增长,人们对配送服务水平的要求愈来愈高,配送速度已经成为最受关注的要素。对于企业而言,建立快速响应体系已经成为必然要求。然而,快速响应体系的建立往往意味着成本的增加。从配送的角度,如何保持降低成本和快速响应客户需求的平衡已经成为企业亟待解决的问题。精细化配送是解决这个问题的重要切入点,它源于精益生产,把精细化思想引入物流过程,从物流末端客户需求出发进行各配送站点的产品配送需求识别,旨在通过配送需求识别提前洞悉未来需求量,从而提前备货以提高配送效率,同时降低物流各个作业环节的成本。实施精细化配送的关键是提前进行配送需求识别,配送需求识别可以细化为需求对象识别和需求量识别两个方面。需求对象识别是指提前挖掘潜在客户,以实现精准营销和洞察未来需求。需求量识别是指根据历史数据提前预测站点销量,以优化仓储管理从而降低配送成本。目前,配送站点的需求管理一般是使用经验预判、按期补货等传统方式,存在着不确定性大、对专家的依赖性强等问题。从海量数据中挖掘有价值的信息,使用数据来驱动精细化配送需求识别,可以科学合理的解决这些问题。数据驱动精细化配送需求识别的核心,是在数据的基础上利用相应的算法模型做潜客挖掘和销量预测。但是,企业目前使用的数据系统还是以IOE为主的传统设施,面对使用机器学习算法处理海量数据的场景,服务器的单节点数据库是无法承载数据的挖掘和计算任务的。针对此问题,本文引入分布式环境下的大数据技术,通过相应组件构建独立于业务系统的数据系统,在此基础上构建精细化配送需求识别的两个模型。配送需求对象识别解决送给谁的问题,以爬虫获取的外部数据为基础进行潜在客户的挖掘。挖掘过程中具体使用的机器学习方法包括构建独热变量(one-hot encoding)和分类回归树(CART)等。配送需求量识别解决什么时候送、送多少的问题,以配送站点历史销售数据为基础进行销量预测,具体方法为在特征工程的基础上构建岭回归(Ridge Regression)和超级梯度提升树(eXtreme Gradient Boosting)模型等。根据广州某液化石油气公司的精细化配送需求,在数据系统中实际构建了需求对象识别模型和需求量识别模型,并在验证集上进行评估,选择了运行效果最佳的模型。模型代码主要使用python语言编写,过程中用到的库包括原生XGBoost和机器学习库sklearn等。通过配送需求识别模型,优化了各个配送站点的仓储和订货管理,使站点总是处于供需均衡的状态,能满足客户的实时需求,提高了配送的效率和客户满意度。