基于Xgboost和Logistics融合算法客户流失预测

来源 :兰州大学 | 被引量 : 1次 | 上传用户:yp7611
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着5G时代的来临和电信市场类型的转变,电信行业的竞争越来越激烈,所以电信公司均开展以客户为中心的服务策略,挽留老客户,争取新客户,进而达到利润最大化的目的.本文首先对问题的背景、意义以及国内外研究现状进行了概述.其次介绍了客户关系管理的主要思想,以及客户关系管理的价值创造.从数据角度,用主要分类算法研究并预测当前客户流失的方向,如随机森林、支持向量机、人工神经网络等.本文在第四章,对客户流失数据进行可视化探索性分析,通过将客户分为流失类和非流失类,研究不同变量在不同客户类别的差异与变化.对于属性变量,研究不同变量在不同客户下的分布柱状图,结合各属性变量在不同客户类型的样本占比基于变量在实际中意义,分析变量对客户流失的影响;对于数值变量,根据分布直方图拟合出变量在不同客户的概率密度曲线,进行对比研究.通过探索性分析筛选对客户流失与否无较大影响的特征,再结合变量重要性指标确定最终进入模型的15个特征.最后按照特征提取、数据编码、分类预测的建模思想对客户流失分类实现的预测.为了提高模型预测精度与运行效率,将Xgboost支持并行计算与处理交互作用的优点和Logistics回归在线性回归预测上的良好性能相结合,提出将Xgboost与Logistics融合的模型.随后为了研究融合算法的预测性能,将融合算法和随机森林、Xgboost、Logistics算法作比较,通过ROC曲线、准确率、精准率、召回率、AUC值等指标比较发现,基于Xgboost与Logistics融合的分类算法其各项指标都得分最高,其中AUC值达到0.94,要明显优于单一分类算法和一般的集成学习.由此证明新的模型对于客户流失管理是有效的.
其他文献
一、讲究特色,让学生保持学习兴趣    兴趣是学习的内在动力。特色作业能有效唤起学生再学习、再认识的兴趣,能促进学生乐意地去探知、获知,使之想学、会做、善创造。一位教师教学“质数和合数”时,设计了“比一比,哪一队获胜”的一组题,并按座位号将班级学生分为质数队和合数队,以竞赛形式组织教学活动,1号学生当裁判。  1.必答题。  (1)合数至少有________个约数。(质数队回答)(2)质数只有__
1核化学与核材料化学1.1氚化学与氚工艺利用微波加热还原制备了高分散度的Pt-Ir疏水催化剂,对氢水交换反应显示出高的催化活性。研制成功实验规模的低温精馏装置,在该装置上进行
行固定法是一种基于MPI并应用在高性能计算机系统上的并行算法,该算法很好地运用了矩阵的特性,不论用高斯消去法解线性方程组、还是对矩阵进行LU分解或者对矩阵进行m次幂计算的大规模
1IntroductionTohaveproperstifnessanddampingisanessentialconditionforanactivemagneticbearingsystemtoworknormaly.Thestifnessofa...
NomenclaturesAArea(m2)EEnergyControl(J)fPressureLossCoeficientaVoidFractionHSpecificEnthaply(J/kg)IInertance(m)KFrictionLossC...
目的研究中药饮片调剂中审方的作用与改进策略。方法选取我院在2014年2月至2015年2月间实施中药饮片调剂审方改进的650例中药饮片调剂(研究组),与2013年1月至2014年1月间未实
提出一种有向权图的拓扑排序算法,并给出一实例说明其应用。
应用Gill本征模的浅水运动方程,在非长波近似下,研究了海洋加热(热源)尺度对热带大气垂直环流圈结构的影响。指出,当热源的纬向尺度小时,大气运动的结构与Gill的长波近似解一