基于Lasso和RBF的客户流失预测模型研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:rooku
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
日益趋于饱和的市场导致企业扩大其市场份额变得愈发困难,企业客户的增长要消耗企业更多的成本。因此,如何稳定存量客户已然成为企业的关注目标。存量老客户的流失,不仅给企业带来巨大的经济损失,还能减弱企业的社会影响力。因此,提前对企业客户进行流失预测,提出有针对性的营销策略,将成为挽留客户、保持业务稳定发展的主要抓手。现如今,大数据分析技术得到了广泛应用,企业利用其数据资产指导经营决策成为必然。在客户流失预测过程中,通过对特征维度高、特征动态变化且数据不均衡等复杂大数据场景进行建模分析,准确地预测客户流失的倾向,以为企业营销策略提供有效依据。论文提出基于Lasso回归的RBF优化模型,结合客户生命周期,建立客户流失预测模型,并基于某银行公开数据集和某地州电信企业的脱敏数据集对模型进行验证。论文主要工作包括:1.针对客户数据信息中流失客户与非流失客户数据严重不平衡、客户数据特征维度高、特征值动态变化等问题,提出基于Lasso回归的RBF优化模型L-RBF。该模型利用混合采样方式平衡数据集,从而提高目标识别率;为提高模型的灵活性、通用性和预测效果,进一步构建了RBF神经网络算法参数模型。通过与Logistic regression、RBF和Boosting-L等算法进行实验对比分析,结果表明,L-RBF模型具有更高的召回率和更好的预测分类能力。此外,对L-RBF模型进行了应用验证,并对模型提取的特征进行属性分析和解释,以便对客户流失问题提出初步建议。2.由于电信客户在不同时期对企业产品的需求存在差异,从而导致客户样本空间特征及其属性值也有所区别。为此引入客户生命周期概念,提出基于全生命周期的电信客户流失预测模型。该模型按照生命周期的不同阶段将数据集划分为多个子集,并应用L-RBF模型得到全生命周期特征属性集合,同时对全生命周期的特征属性进行趋势分析与关联分析,以便于各阶段的针对性营销。通过与无生命周期数据集划分进行实验对比,结果表明,基于全生命周期的预测模型在目标识别、关联特征获取等方面具有更好的效果。研究工作表明,基于L-RBF优化模型、采用全生命周期的电信客户流失预测模型,不仅可以有效预测有流失倾向的客户,同时还能降低不同业务需求下的客户特征对预测结果的影响,从而有效提升模型准确率,具有较好的理论研究与实践意义。
其他文献
目的建立高效液相色谱法测定珍菊降压片中氢氯噻嗪及芦丁的含量。方法采用高效液相色谱法,色谱柱为十八烷基硅烷键合硅胶为填充剂的色谱柱(250×4.6mm,5μm),以0.05mol/L枸橼酸溶
耕地及耕地质量对于我国粮食安全、经济良性发展及社会和谐稳定都是至关重要的。改革开放以来经济发展导致耕地数量锐减,尤其是城镇建设占用大量优质农田;另外,新技术、新品
通过对2000—2009年《图书情报工作》所载论文参考文献中网络引文的数量变化、网络引文衰减情况和半衰期、网络引文衰减原因、网络引文域名、网络引文深度等方面进行统计、分
水广泛存在于自然界中,具有许多奇特的性质,且学术界对水分子体系的结构仍在探索。鉴于之前开发的原子-键电负性均衡七位点ABEEM2004水分子模型更加准确的描述静电相互作用,
20世纪80年代以来,当代中国史在体制化与学术化的双重进程中,已成长为中国历史学领域中一门新兴且显要的学科。从学术史的角度观之,它的研究历程经历了从通史研究到专题史研
目的:探索miRNA靶向疗法和ZY-1多肽对角膜新生血管(neovascularization,NV)的抑制作用,研究其分子作用机制,并评估其眼用安全性。方法:(1)在碱烧伤诱导的小鼠角膜NV模型中,运
随着国家社会的发展,经济时代的变化,各民族的交往越来越频繁,汉语是各民族交流的唯一媒介,熟练掌握汉语能更好地促进各民族的沟通与团结。海南是个以黎族为主的民族聚居地,
目的:研究和分析用曲美他嗪治疗稳定型劳力性心绞痛的效果。方法:选择渠县人民医院收治的90例稳定型劳力性心绞痛患者作为研究对象。将这90例患者随机分为常规组和曲美他嗪组。
本文分析了多媒体阅览室的服务现状及影响其功能发挥的因素,提出了增强服务功能的对策。