论文部分内容阅读
当今社会已进入大数据时代,金融行业亦是如此,在此大环境下,银行将发展金融信贷业务与“机器学习+智能优化算法”进行紧密而有效的结合,旨在构建以大数据智能化、自动化和分析准确度高为主要业务目标的智能算法模型,同时使之既符合金融行业的特点又可和大数据的相关基础技术应用进行紧密结合。如何从海量的信贷用户数据中挖掘出信贷风险最低的客户特征,通过构建预测模型识别出信贷客户类型以降低信贷风险已成为研究的主流。本文针对高维特征的信贷数据提出采用鲸鱼优化算法去寻找特征空间中的最优解,对特征组合进行搜索同时以模型的信贷风险实际分类的情况,从原始的数据集合中找到并选择出对模型贡献最大的子集。然后根据组合模型选择的特征子集最优模型和特征子集变量组合模型构建基于BP神经网络(Back Propagation Neural Network)的信贷风险评估预测模型,并在本文中利用鲸鱼分析算法对BP神经网络的初始预测权重和初始的阈值预测准确性关系进行了分析和优化,并且以此基础方法应用来有效地提高信贷风险评估预测处理模型的可靠性和准确率。本文主要重点工作的研究内容概述如下:(1)提出了在鲸鱼算法的基础上利用极限学习机而创建出来的信贷风险特征选择模型。本文使用的原始信贷数据集是Home Credit数据集,第一步是对数据集中有所缺失的数据值进行处理,同时对其中的异常值进行修正,其次对其进行编码和归一化的预操作处理。然后用基于鲸鱼算法(WOA)结合极限学习机对数据预处理后的原始信贷数据集进行信贷风险特征选择。将极限学习机(ELM)作为分类器,从最为原始的特征数据集合中无目的性的随意的初始化各特征子集,以分类误差为适应度函数对特征选择的结果进行评估,通过鲸鱼算法不断迭代寻优,找出最优的特征子集,即分类误差较小,而准确性最好的一组信贷风险特征组合。初始化的实验分析结果表明,在经过原始特征子集选择后,分类误差准确率可以提升到更高,而基于WOA-ELM信贷风险特征子集选择初始化模型选中的信贷风险特征子集个数较少,分类的误差较少,其准确率较高,同时所需要花费的时间亦少,总之最终综合分析的性能较优。(2)构建了使用鲸鱼算法来调优BP神经网络初始权阈值的信贷风险评估预测模型。利用BP神经网络对信贷风险的相关情况进行计算与评估,并且使用鲸鱼算法对BP神经网络的初始权阈值进行调优。结果表明:WOA算法寻优能力相较PSO算法以及GA算法更为优秀,其均方误差更小,收敛速度更快,利用了WOA模型算法对基于BP神经网络的初始权值和阈值模型进行了优化,可使基于BP模型的稳定值和信贷风险模型预测的准确率更高,同时也可以使其泛化的能力更强。(3)提出一种对鲸鱼算法进行调整,使之更为优秀的方案。首先对初始种群进行改进,采用在混沌映射概念上的的种群初始化方法,提高初始种群质量。然后是对鲸鱼算法中距离控制参数a改为非线性下降,使之收敛的速度变慢,避免其陷入局部范围内的最优值。最后控制选择随机搜索概率大于选择螺旋上升的概率,提高全局寻优的范围。研究表明通过在不同的基准测试函数上的分类实验和对比,改进后的鲸鱼分类算法的收敛分类速度和全局鲸鱼分类寻优的能力比改进前传统的鲸鱼分类算法更好。通过研究并用改进后的全局鲸鱼分类算法设计和优化了BP神经网络的信贷风险预测模型,实验的结果表明经过改进后分类的准确率更高。本文构建了基于鲸鱼算法优化的信贷特征选择模型和信贷风险预测模型。实验证明鲸鱼算法优化后,信贷风险特征个数减少,信贷风险预测准确率更高。