论文部分内容阅读
日益趋于饱和的市场导致企业扩大其市场份额变得愈发困难,企业客户的增长要消耗企业更多的成本。因此,如何稳定存量客户已然成为企业的关注目标。存量老客户的流失,不仅给企业带来巨大的经济损失,还能减弱企业的社会影响力。因此,提前对企业客户进行流失预测,提出有针对性的营销策略,将成为挽留客户、保持业务稳定发展的主要抓手。现如今,大数据分析技术得到了广泛应用,企业利用其数据资产指导经营决策成为必然。在客户流失预测过程中,通过对特征维度高、特征动态变化且数据不均衡等复杂大数据场景进行建模分析,准确地预测客户流失的倾向,以为企业营销策略提供有效依据。论文提出基于Lasso回归的RBF优化模型,结合客户生命周期,建立客户流失预测模型,并基于某银行公开数据集和某地州电信企业的脱敏数据集对模型进行验证。论文主要工作包括:1.针对客户数据信息中流失客户与非流失客户数据严重不平衡、客户数据特征维度高、特征值动态变化等问题,提出基于Lasso回归的RBF优化模型L-RBF。该模型利用混合采样方式平衡数据集,从而提高目标识别率;为提高模型的灵活性、通用性和预测效果,进一步构建了RBF神经网络算法参数模型。通过与Logistic regression、RBF和Boosting-L等算法进行实验对比分析,结果表明,L-RBF模型具有更高的召回率和更好的预测分类能力。此外,对L-RBF模型进行了应用验证,并对模型提取的特征进行属性分析和解释,以便对客户流失问题提出初步建议。2.由于电信客户在不同时期对企业产品的需求存在差异,从而导致客户样本空间特征及其属性值也有所区别。为此引入客户生命周期概念,提出基于全生命周期的电信客户流失预测模型。该模型按照生命周期的不同阶段将数据集划分为多个子集,并应用L-RBF模型得到全生命周期特征属性集合,同时对全生命周期的特征属性进行趋势分析与关联分析,以便于各阶段的针对性营销。通过与无生命周期数据集划分进行实验对比,结果表明,基于全生命周期的预测模型在目标识别、关联特征获取等方面具有更好的效果。研究工作表明,基于L-RBF优化模型、采用全生命周期的电信客户流失预测模型,不仅可以有效预测有流失倾向的客户,同时还能降低不同业务需求下的客户特征对预测结果的影响,从而有效提升模型准确率,具有较好的理论研究与实践意义。