论文部分内容阅读
随着信息化技术的发展,传统的业务模式已不再适应目前银行业的发展,银行在关注自己资产的同时,更重要的是认识到客户管理的重要性,拥有良好的客户关系是银行业实现巨大财富收入的保障。因此,注重银行客户行为的研究成为当今研究的热点之一。然而,大量的银行客户信息仅依靠人工的处理方法很难进行管理,数据挖掘方法正是解决这一问题的有效技术。通过深度挖掘银行客户的行为,能够为银行营销策略的制定提供合理有效的建议。k均值(k-means)聚类算法是数据挖掘中较有效的算法,以其处理速度快、思路简单且易于实现等优点成为大数据时代数据挖掘的常用方法。但该算法存在对初始聚类中心点敏感、容易陷入局部最优等缺点。在本文中,为提高银行客户群分类拓展的效率及稳定性,提出了一种改进的k-means聚类优化算法。该算法利用自编码器对给定的银行客户信息数据集进行特征学习以减少数据集维数,再结合k-means聚类优化算法对数据集进行细分。对于聚类过程优化,先通过改进的肘部法则自动确定客户数据集分类数;然后根据局部离群因子检测方法筛选出离群因子较小的一部分客户数据作为初始聚类中心的候选集以更准确地找到初始聚类中心点;最后根据离群因子加权距离法优化聚类中心,从而实现对银行客户数据的无监督分类。通过选取UCI公共数据集上的数据对该算法进行测试,其稳定性强且准确率比k-means++平均高出19%,比OFMMK-means平均高出11%,比FCM平均高出9%,平均运行时间比FCM算法缩短87.5%。所提出的算法能够更有效地对银行客户数据进行挖掘。