论文部分内容阅读
摘 要:中国信用卡产业已经陆续进入“精耕细作”的时代,在信用卡风险管理领域已经成熟的应用了信用评分技术,在市场活动管理领域同样可以利用强大的评分卡技术进行精细化管理。把评分卡技术应用到市场营销活动的各个领域,通过各类市场评分模型的应用来获取目标客户。本文详细介绍了利用评分卡进行市场营销活动管理的优势,总结了评分卡开发的完整方法论。
关键词:信用卡评分卡市场营销活动方法论
中图分类号:F830.49 文献标识码:A 文章编号:1674-098X(2011)08(a)-0214-02
1评分卡技术介绍
评分卡技术是指运用先进的数据挖掘和统计分析方法,通过对历史数据的特征分析,预测客户的未来表现的模型。常见的可以应用的算法技术有:判别分析法、线性回归、logistic回归、分类树、神经网络等。国外学者对上述模型的精确度进行研究,认为各种不同的技术精确度差异并不显著[1]。
评分卡技术用科学的预测代替猜测行为。充分挖掘数据价值,为决策提供了更相关、更准确的信息,从而使得决策更科学、更加公正可信。评分卡技术可以帮助决策人员提前预测客户行为,使得决策更有前瞻性,有效提高活动的效率。
2评分卡的应用领域
目前评分模型在信用卡领域的应用主要集中于风险管理领域。评分卡技术在信用风险领域的研究最早始于1940年代末至1950年代初。经历了数十年的摸索与实践,在国内外都有较为成功的实践。如:信用卡申请评分模型,交易欺诈预测模型,催收评分模型等。
本文将评分卡技术引入于信用卡营销活动管理领域。通过对持卡人的人口统计学特征、信用历史记录、行为记录和交易记录等大量数据进行系统分析,挖掘持卡人的行为模式、消费习惯、信用特征等信息。细分客户群体,针对目标客户群的典型特征,有针对性的开展营销活动,有效节约成本,提高营销活动的回报率。在具体应用场景中,某个客户其在未来三个月流失的概率、未来一年内给我们带来收益的潜力大小,对市场活动的敏感性大小,或者接受附属卡推销的可能性等等,这些都可以开发各类相对应的评分卡来指导市场营销活动。如果开发流程科学、应用方法正确,评分模型能提供大量具有高度预测力的信息,帮助决策人员制定行之有效的活动管理策略,以较高的精度有效的开拓市场,挖掘收益,实现信用卡业务的高收益。
3评分卡的开发过程
评分卡的开发过程必须结合特定的营销活动场景进行,主要的开发过程包括:变量选择和确定、样本选择、评分卡的建立与调整、评分卡的评估和应用等。下面以客户流失预测评分卡为例,介绍整个评分卡的开发过程。
3.1 变量选择和确定
变量的选择和确定是评分卡开发成功的关键因素。输入变量用于在建模过程中作为自变量寻找与目标结果之间的关系,因此需要寻找与目标变量关联性强的变量。为了不遗漏变量,不损失变量,建议把所有相关变量都准备在变量库中,并且按一定的规则进行变量衍生,对所有变量进行全筛选,从中刷选出对目标变量相关性最强的变量。
变量分类两类:静态变量和动态变量。静态变量指的是通常不会经常改变的信息,如性别,年龄,收入,婚姻状况,受教育学历,职业,行业类别等入口统计学变量。动态变量指的是经常或定期改变的数据,如每月消费金额,取现金额,分期金额,逾期金额,发生的费用金额,循环信用金额等等。为充分挖掘数据背后的信息,还需要对动态变量按照一定的规则进行衍生,如最近N个月的平均值,最近N个月有发生的月份数,最近N个月最大发生金额,最近N个月平均值除以最大值等等。
3.2 样本选择
一般来说评分卡开发是在小样本数据上进行,而不是全样本数据上进行,因此需要在全样本数据上进行随机采样。在开发客户流失预测评分卡中,客户流失率相对比较低,三个月流失率在3%左右,先验概率过低,就不容易找出流失客户的特征,模型的效果也会随之降低,那就需要进行过采样,通过过采样使流失的比率提高到20%左右。经过了过采样之后,还需要把样本数据随机分成两个部分,一部分为建模数据、一部分为验证数据,一般分别占80%与20%左右。建模数据用来建模使用,验证数据用来对模型进行验证与修正。
3.3 评分卡的建立与调整
在变量选择阶段总结了大量的静态变量与动态变量及衍生变量,但最后进入到评分卡中往往只需要15到20个左右的变量,因此建模过程中需要进行变量的筛选,首先需要对所有的变量进行信息值(Information Value)计算,取信息值较高的变量,以此来进行变量的粗选,经过变量粗选的变量有可能存在共线性,因此需要做一些共线性的检查,剔除具有共线性的变量。经过这两层的变量筛选后一般会剩余50个左右,这时需要以逐步回归来精选变量,通过此次筛选进入模型的变量一般控制在15个左右。
3.4 评分卡的评估与应用
评分卡的评估应该利用未参与建模开发的数据进行,这样才能得到准确的结果。如果使用建模的数据对模型进行检验,由于模型就是按照这些数据建立的,检验结果自然会很好。但是一旦运用到实际数据中,就会产生很大的偏差,所以必须使用保留的验证数据对模型进行检验。在模型检验中一般以提升表就可以来评估评分卡的效果。以流失预测评分卡为例来解释提升表各个指标的含义(如表1)。
通常把验证数据根据评分从高到低分成二十组,通过提升表来观察每组的表现及整体趋势,提升表中边际响应率是指该单元格中预测流失的客户数占所有流失客户总数的占比,一个稳定的模型边际响应率应该是稳步下降的,如果有跳跃,说明模型的稳定性有待加强。累计响应率是指截止到改组累计预测流失的客户数占所有流失客户总数的占比,模型的效果越好,累计响应率数值越靠前,说明模型效果越好。同样提升指数也可以直观的衡量模型的效果,提升指数是指用了评分卡以后预测成功而产生提升的倍数。K-S衡量的是模型的区分度,指的是流失客户与未流失客户累计分布比例之间距离的最大值,K-S指标越高,模型的区分度越强。
根据该提升表结果,可以针对不同组别的客户制订不同的营销策略,甚至可以结合对这一特定群体的特征分析,选择最为有效的促销策略。例如把对不同组别的客户选择不同的沟通渠道,给予不同的营销奖励。
4结语
评分卡技术不仅可以在风险管理领域发挥巨大的作用,同样在市场营销活动管理领域也可以发挥巨大的作用,通过评分卡技术的应用,可以迅速准确的帮助市场活动策划者定位目标客户,找到最有价值的客户,也可以挖掘出潜在的客户,从而达到成本最小化,利润最大化,同样为制定正确、科学的管理策略,同样需要发展、应用各类评分卡,从对与决策效益密切相关的各方面的未来表现都进行科学、准确地预测。以评分卡技术作为管理决策的主要依据,必将成为管理信用卡各个领域的核心技术手段。
参考文献
[1] 姜盛.基于Logistic的信用卡套现侦测评分模型.计算机应用[J],2009.11.
[2] Jiawei Han,Micheline Kamber著.数据挖掘概念与技术[M].范明,孟小峰等译.北京:机械工业出版社,2001.
[3] 吴洪涛.商业银行信用卡业务[M].北京:中国金融出版社.2003.
[4] 邓丽梅,沈蕾.浅论信用卡市场的营销策略.上海金融[J].2001,255(10).
[5] 陈建.信用评分模型技术与应用[M].北京:中国财政经济出版社.2005.
[6] 陈建.现代信用卡管理[M].北京:中国财政经济出版社.2005.
关键词:信用卡评分卡市场营销活动方法论
中图分类号:F830.49 文献标识码:A 文章编号:1674-098X(2011)08(a)-0214-02
1评分卡技术介绍
评分卡技术是指运用先进的数据挖掘和统计分析方法,通过对历史数据的特征分析,预测客户的未来表现的模型。常见的可以应用的算法技术有:判别分析法、线性回归、logistic回归、分类树、神经网络等。国外学者对上述模型的精确度进行研究,认为各种不同的技术精确度差异并不显著[1]。
评分卡技术用科学的预测代替猜测行为。充分挖掘数据价值,为决策提供了更相关、更准确的信息,从而使得决策更科学、更加公正可信。评分卡技术可以帮助决策人员提前预测客户行为,使得决策更有前瞻性,有效提高活动的效率。
2评分卡的应用领域
目前评分模型在信用卡领域的应用主要集中于风险管理领域。评分卡技术在信用风险领域的研究最早始于1940年代末至1950年代初。经历了数十年的摸索与实践,在国内外都有较为成功的实践。如:信用卡申请评分模型,交易欺诈预测模型,催收评分模型等。
本文将评分卡技术引入于信用卡营销活动管理领域。通过对持卡人的人口统计学特征、信用历史记录、行为记录和交易记录等大量数据进行系统分析,挖掘持卡人的行为模式、消费习惯、信用特征等信息。细分客户群体,针对目标客户群的典型特征,有针对性的开展营销活动,有效节约成本,提高营销活动的回报率。在具体应用场景中,某个客户其在未来三个月流失的概率、未来一年内给我们带来收益的潜力大小,对市场活动的敏感性大小,或者接受附属卡推销的可能性等等,这些都可以开发各类相对应的评分卡来指导市场营销活动。如果开发流程科学、应用方法正确,评分模型能提供大量具有高度预测力的信息,帮助决策人员制定行之有效的活动管理策略,以较高的精度有效的开拓市场,挖掘收益,实现信用卡业务的高收益。
3评分卡的开发过程
评分卡的开发过程必须结合特定的营销活动场景进行,主要的开发过程包括:变量选择和确定、样本选择、评分卡的建立与调整、评分卡的评估和应用等。下面以客户流失预测评分卡为例,介绍整个评分卡的开发过程。
3.1 变量选择和确定
变量的选择和确定是评分卡开发成功的关键因素。输入变量用于在建模过程中作为自变量寻找与目标结果之间的关系,因此需要寻找与目标变量关联性强的变量。为了不遗漏变量,不损失变量,建议把所有相关变量都准备在变量库中,并且按一定的规则进行变量衍生,对所有变量进行全筛选,从中刷选出对目标变量相关性最强的变量。
变量分类两类:静态变量和动态变量。静态变量指的是通常不会经常改变的信息,如性别,年龄,收入,婚姻状况,受教育学历,职业,行业类别等入口统计学变量。动态变量指的是经常或定期改变的数据,如每月消费金额,取现金额,分期金额,逾期金额,发生的费用金额,循环信用金额等等。为充分挖掘数据背后的信息,还需要对动态变量按照一定的规则进行衍生,如最近N个月的平均值,最近N个月有发生的月份数,最近N个月最大发生金额,最近N个月平均值除以最大值等等。
3.2 样本选择
一般来说评分卡开发是在小样本数据上进行,而不是全样本数据上进行,因此需要在全样本数据上进行随机采样。在开发客户流失预测评分卡中,客户流失率相对比较低,三个月流失率在3%左右,先验概率过低,就不容易找出流失客户的特征,模型的效果也会随之降低,那就需要进行过采样,通过过采样使流失的比率提高到20%左右。经过了过采样之后,还需要把样本数据随机分成两个部分,一部分为建模数据、一部分为验证数据,一般分别占80%与20%左右。建模数据用来建模使用,验证数据用来对模型进行验证与修正。
3.3 评分卡的建立与调整
在变量选择阶段总结了大量的静态变量与动态变量及衍生变量,但最后进入到评分卡中往往只需要15到20个左右的变量,因此建模过程中需要进行变量的筛选,首先需要对所有的变量进行信息值(Information Value)计算,取信息值较高的变量,以此来进行变量的粗选,经过变量粗选的变量有可能存在共线性,因此需要做一些共线性的检查,剔除具有共线性的变量。经过这两层的变量筛选后一般会剩余50个左右,这时需要以逐步回归来精选变量,通过此次筛选进入模型的变量一般控制在15个左右。
3.4 评分卡的评估与应用
评分卡的评估应该利用未参与建模开发的数据进行,这样才能得到准确的结果。如果使用建模的数据对模型进行检验,由于模型就是按照这些数据建立的,检验结果自然会很好。但是一旦运用到实际数据中,就会产生很大的偏差,所以必须使用保留的验证数据对模型进行检验。在模型检验中一般以提升表就可以来评估评分卡的效果。以流失预测评分卡为例来解释提升表各个指标的含义(如表1)。
通常把验证数据根据评分从高到低分成二十组,通过提升表来观察每组的表现及整体趋势,提升表中边际响应率是指该单元格中预测流失的客户数占所有流失客户总数的占比,一个稳定的模型边际响应率应该是稳步下降的,如果有跳跃,说明模型的稳定性有待加强。累计响应率是指截止到改组累计预测流失的客户数占所有流失客户总数的占比,模型的效果越好,累计响应率数值越靠前,说明模型效果越好。同样提升指数也可以直观的衡量模型的效果,提升指数是指用了评分卡以后预测成功而产生提升的倍数。K-S衡量的是模型的区分度,指的是流失客户与未流失客户累计分布比例之间距离的最大值,K-S指标越高,模型的区分度越强。
根据该提升表结果,可以针对不同组别的客户制订不同的营销策略,甚至可以结合对这一特定群体的特征分析,选择最为有效的促销策略。例如把对不同组别的客户选择不同的沟通渠道,给予不同的营销奖励。
4结语
评分卡技术不仅可以在风险管理领域发挥巨大的作用,同样在市场营销活动管理领域也可以发挥巨大的作用,通过评分卡技术的应用,可以迅速准确的帮助市场活动策划者定位目标客户,找到最有价值的客户,也可以挖掘出潜在的客户,从而达到成本最小化,利润最大化,同样为制定正确、科学的管理策略,同样需要发展、应用各类评分卡,从对与决策效益密切相关的各方面的未来表现都进行科学、准确地预测。以评分卡技术作为管理决策的主要依据,必将成为管理信用卡各个领域的核心技术手段。
参考文献
[1] 姜盛.基于Logistic的信用卡套现侦测评分模型.计算机应用[J],2009.11.
[2] Jiawei Han,Micheline Kamber著.数据挖掘概念与技术[M].范明,孟小峰等译.北京:机械工业出版社,2001.
[3] 吴洪涛.商业银行信用卡业务[M].北京:中国金融出版社.2003.
[4] 邓丽梅,沈蕾.浅论信用卡市场的营销策略.上海金融[J].2001,255(10).
[5] 陈建.信用评分模型技术与应用[M].北京:中国财政经济出版社.2005.
[6] 陈建.现代信用卡管理[M].北京:中国财政经济出版社.2005.