论文部分内容阅读
在我国,铁路货物运输承担着社会发展物资与战略性物资的运输任务,是我国物流体系的重要组成部分。随着社会经济的快速发展,人们的生活水平逐渐提高,所需要的生产生活物资需求随之增加,致使货物运输需求上升,新的货物运输方式应运而生,货运行业市场竞争也愈演愈烈。在机遇与挑战并存的时代,铁路货运没有延续优势,相反在市场竞争中处于下游地位,客户流失严重。因此铁路企业想要站稳脚跟、向前发展,那么怎样有效挖掘客户,是其首要解决的问题。目前对于大客户的研究数据量一般都较小,且数据来源单一。因此本文在大数据基础上融合内外部数据,对铁路货运客户进行分析,提出大客户模型L(length)R(Recency)F(Frequency)A(Average monetary)V(rotation Volume of freight transport),构建KCPM模型(大客户个体画像模型)。最后基于大客户个体画像模型对铁路货运大客户进行流失预测。具体研究工作如下:(一)结合行业特征和现有数据特点,在RFM模型中引入了客户相对客龄(L)、客户货运周转量(V)两个参数,把客户运输消费总金额(M)转换为客户平均运输消费总金额(A),从而构建货运大客户模型LRFAV。然后将铁路货票数据进行数据集成、数据清洗、数据规约、数据转换,并对比分析RFM、LRFM、LRFAV模型。接着在专家指导下利用AHP方法赋予大客户模型变量对应权重,最后使用K-Means++聚类算法对铁路货运客户分类,计算出各类别客户的客户价值,筛选出大客户。(二)首先分析大客户画像模型构建的可行性。接着将筛选出的大客户货票数据与非大客户货票数据按1:4随机混合形成内部数据集,并在企查查官网上爬取内部数据集中客户的外部数据。之后将内外部数据融合得到大客户画像数据集,从中提取客户画像的分析特征指标,并对特征指标数据进行数据预处理、卡方独立性检验、pointbiserialr(点双线相关系数)检验、皮尔逊相关系数检验、共线性诊断以去除冗余变量,获得大客户画像分析数据。最后对大客户画像分析数据中特征变量的值使用K-Means聚类进行分段,得出KCPM模型(大客户个体画像模型)。(三)基于大客户画像分析数据特点,定义流失客户。使用Logistic回归、决策树与BP神经网络三种方法对铁路货运大客户进行流失预测。对比发现,BP神经网络方法预测效果更好,对铁路货运流失大客户的召回率达到95%,基本满足了预测需求。这有利于帮助铁路集团挽留货运大客户,减少重大损失的发生。