聚类算法在银行客户细分中的研究和应用

被引量 : 0次 | 上传用户:wangjj167
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是一种新兴的决策支持工具,而聚类分析是该领域的核心技术和非常活跃的研究方向。客户细分是客户关系管理的重要组成部分,它是指企业根据客户的内在和外在属性、及客户的消费行为特征对其分类,从而为不同类别的客户提供针对性的产品和服务。聚类是客户细分的有力工具,尤其是在金融行业中日益发挥出积极的导向作用。聚类是一种无监督学习过程,它按照事物的属性特征把事物聚集成若干簇,使同一簇内的数据对象之间具有较高的相似性,而不同簇之间的数据对象相似度较低。聚类融合是将多个聚类结果进行组合来获得更加鲁棒和聚类准确率更高的数据划分结果。本文提出了一种基于投票机制的两层聚类融合模型,它通过解决以下几个方面的问题来实现对聚类精度及算法鲁棒性的提升:聚类成员的生成问题:聚类成员是聚类融合算法的基础,生成聚类成员的核心问题是获得多个相互具有差异性的原始聚类结果。在本文提出的模型中,涉及两个层次的聚类成员:第一层聚类成员为原始的聚类算法产生的聚类结果,它通过为多种聚类算法设置不同的参数来获得;第二层的聚类成员是将同一种算法在不同参数下的聚类结果进行组合得到的聚类融合结果,也就是说第二层的聚类成员兼具聚类融合结果和聚类成员两个方面的性质。通过选择不同类型的聚类算法和设置不同的初始化参数可以得到有差异性的聚类成员,提高聚类融合质量。聚类融合函数设计问题:它是指用什么样的方法将多个聚类结果组合起来从而提升原始聚类算法的聚类效果。在本文的两层聚类融合模型中,主要采用多个聚类结果投票的方法作为聚类融合函数。投票机制的核心思想是一组成员对某件事物的共同判断优于单个成员的判断,它具有简单有效且便于理解的特点。聚类标签的匹配问题:在采用基于投票的聚类融合方法时,确定不同数据划分中簇的对应关系也是一个十分重要的问题。不同的算法、甚至同一个算法在不同参数下的聚类结果对实质相同的同一个簇的描述或标签都可能是不同的。在本文研究中,通过将两次聚类中共享数据点最多的两个簇设置相同的类标号来解决标签匹配问题。本文还探讨了客户细分的一般性方法;并采用实证分析方法,利用某银行投资理财业务的客户基本资料和各类原始交易数据,通过设计先聚类后分类的数据挖掘方案,建立了有效的客户细分模型,这对银行提高客户关系管理的科学性有一定借鉴意义;并通过实际应用,验证了本文所提出的两层聚类融合方法的效果和适用性。
其他文献
世界上有各种饮食文化的存在,饮食工具也自然承载着不同民族不同国家的文化要素。中国、日本、朝鲜半岛和越南等同属于“箸食”文化地区,但箸的使用方法和箸的形状不完全相同
目的观察慢性阻塞性肺疾病(慢阻肺)患者膈肌厚度变化,评价其与活动耐力和呼吸困难的关系。方法选取2015年8月至2016年8月上海市东方医院呼吸门诊收治的慢阻肺患者50例,同时选取
<正>1病例资料姜某,女性,26岁,于2013年3月16日剖腹产下一3.6 kg健康男婴。于剖腹产后10 d,因不慎寒暖,将息失宜,发热至40.8℃(腋下温度)。刻诊:患者面色红赤,头部可见汗出,
<正> 一、信息化对就业的影响 (一)对就业量的影响 1.应用信息技术提高生产效率,短期内使企业用工人数绝对减少,萎缩劳动力需求,长期具有刺激劳动力需求扩张的作用。从技术冲
本试验就法国番鸭CR51、樱桃谷系大型肉鸭和成都麻鸭,分别进行屠宰测定、肉质氨基酸测定和胸肌营养物质测定.结果表明:法国番鸭活体重、屠宰率、胸肌率及胸肌氨基酸含量普遍
分布在可可西里的国家濒危Ⅰ级保护动物藏羚羊,每年6~7月都集结成群,长途跋涉前往卓乃湖、太阳湖等地产仔,而青藏铁路设置的野生动物通道,是藏羚羊迁徙途中最主要的人为干扰因
<正>湘西土家族吊脚楼是我国南方最具特色的传统民居之一,它受地理、人文环境的影响,有着自己独特的形成和发展轨迹。随着社会的变迁和现代化的进程,以及外来文化的冲击,加上
企业集群令人瞩目的发展来源于其突出的竞争优势,而竞争优势的确立必然以其拥有的竞争力为依据。本文在对国内外企业集群研究文献回顾和评论基础上,运用外部经济理论、竞争优
目的:评估24式简化太极拳运动对老年原发性高血压患者(EH)的降压效果及对患者形态、血脂水平、中医临床症状、生活质量的影响,并评估太极拳与常规步行的效果差异,以期对老年
<正> 上消化道出血(UGIB)的年发病率为48/10~6~160/10~6,死亡率为10%~14%。美国非静脉曲张性UGIB伴并发症者的平均住院天数和住院费用分别为4.4 d和5632美元,无并发症者分别为2