基于鲸鱼优化算法的信贷风险预测研究

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:lipz7517
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会已进入大数据时代,金融行业亦是如此,在此大环境下,银行将发展金融信贷业务与“机器学习+智能优化算法”进行紧密而有效的结合,旨在构建以大数据智能化、自动化和分析准确度高为主要业务目标的智能算法模型,同时使之既符合金融行业的特点又可和大数据的相关基础技术应用进行紧密结合。如何从海量的信贷用户数据中挖掘出信贷风险最低的客户特征,通过构建预测模型识别出信贷客户类型以降低信贷风险已成为研究的主流。本文针对高维特征的信贷数据提出采用鲸鱼优化算法去寻找特征空间中的最优解,对特征组合进行搜索同时以模型的信贷风险实际分类的情况,从原始的数据集合中找到并选择出对模型贡献最大的子集。然后根据组合模型选择的特征子集最优模型和特征子集变量组合模型构建基于BP神经网络(Back Propagation Neural Network)的信贷风险评估预测模型,并在本文中利用鲸鱼分析算法对BP神经网络的初始预测权重和初始的阈值预测准确性关系进行了分析和优化,并且以此基础方法应用来有效地提高信贷风险评估预测处理模型的可靠性和准确率。本文主要重点工作的研究内容概述如下:(1)提出了在鲸鱼算法的基础上利用极限学习机而创建出来的信贷风险特征选择模型。本文使用的原始信贷数据集是Home Credit数据集,第一步是对数据集中有所缺失的数据值进行处理,同时对其中的异常值进行修正,其次对其进行编码和归一化的预操作处理。然后用基于鲸鱼算法(WOA)结合极限学习机对数据预处理后的原始信贷数据集进行信贷风险特征选择。将极限学习机(ELM)作为分类器,从最为原始的特征数据集合中无目的性的随意的初始化各特征子集,以分类误差为适应度函数对特征选择的结果进行评估,通过鲸鱼算法不断迭代寻优,找出最优的特征子集,即分类误差较小,而准确性最好的一组信贷风险特征组合。初始化的实验分析结果表明,在经过原始特征子集选择后,分类误差准确率可以提升到更高,而基于WOA-ELM信贷风险特征子集选择初始化模型选中的信贷风险特征子集个数较少,分类的误差较少,其准确率较高,同时所需要花费的时间亦少,总之最终综合分析的性能较优。(2)构建了使用鲸鱼算法来调优BP神经网络初始权阈值的信贷风险评估预测模型。利用BP神经网络对信贷风险的相关情况进行计算与评估,并且使用鲸鱼算法对BP神经网络的初始权阈值进行调优。结果表明:WOA算法寻优能力相较PSO算法以及GA算法更为优秀,其均方误差更小,收敛速度更快,利用了WOA模型算法对基于BP神经网络的初始权值和阈值模型进行了优化,可使基于BP模型的稳定值和信贷风险模型预测的准确率更高,同时也可以使其泛化的能力更强。(3)提出一种对鲸鱼算法进行调整,使之更为优秀的方案。首先对初始种群进行改进,采用在混沌映射概念上的的种群初始化方法,提高初始种群质量。然后是对鲸鱼算法中距离控制参数a改为非线性下降,使之收敛的速度变慢,避免其陷入局部范围内的最优值。最后控制选择随机搜索概率大于选择螺旋上升的概率,提高全局寻优的范围。研究表明通过在不同的基准测试函数上的分类实验和对比,改进后的鲸鱼分类算法的收敛分类速度和全局鲸鱼分类寻优的能力比改进前传统的鲸鱼分类算法更好。通过研究并用改进后的全局鲸鱼分类算法设计和优化了BP神经网络的信贷风险预测模型,实验的结果表明经过改进后分类的准确率更高。本文构建了基于鲸鱼算法优化的信贷特征选择模型和信贷风险预测模型。实验证明鲸鱼算法优化后,信贷风险特征个数减少,信贷风险预测准确率更高。
其他文献
水稻是我国重要的粮食作物,水稻病虫害的防治对于其安全高产有着重要作用。台湾稻螟Chilo auricilius(Dudgeno)原属于局部偶发性次要水稻害虫,但近年来在广东、广西等地发生
卫星在轨运行期间,各种姿控装置如控制力矩陀螺正常运转时会产生一系列幅值小,频谱宽的微振动,这种微振动会严重降低高分辨卫星上搭载光学载荷的成像质量。采用橡胶减振器是
对桉树林的杂草进行调查,初步筛选出适合在林地除草的10种除草剂;研究桉树和杂草的根系分布,确定根位差;通过亮蓝模拟施药试验,确定最佳施水量;以茎杆喷射的方式对盆栽桉树苗
输油管道作为油品资源的主要输运方式,对社会经济的发展起着举足轻重的作用。然而近年来,管道泄漏事故频繁发生,安全形势愈发严峻。对输油管道的泄漏定位、泄漏速率计算及泄
德冨芦花(18681927)生于明治元年,是日本近代有名的作家。芦花不仅在散文领域造诣颇高,在小说领域也备受欢迎。众所周知,小说《不如归》作为德冨芦花的成名作及代表作备受瞩目。该作品不仅被改编成戏剧和电影,还被翻译成各种语言而广泛流传。芦花在《不如归》这篇小说中塑造了各式各样的女性形象,并为她们设定了不同的命运。阐明这些女性人物形象,及女性形象的特征和创作动机是有一定意义的。此外,《不如归》是根据
载脂蛋白(Apolipoprotein,APO),是组成血浆脂蛋白的重要成分,主要在肝脏和小肠中合成,能够结合并运输血脂到机体各组织进行代谢及利用。除此之外,载脂蛋白在病原体的防御中也
近年来,非线性系统因其在生物、物理、工程等方面的应用而得到了广大学者的关注,此外,由于实际系统通常都会遇到模型不确定性,这可能会对系统性能造成负面影响,因此,对具有参
本论文选取印楝素作为刺激条件,模拟田间施药系统,通过斜纹夜蛾的嗅觉、味觉和视觉对斜纹夜蛾进行联系性学习记忆训练,探究印楝素对斜纹夜蛾的学习记忆行为和生态适应性的影
本研究建立了泰拉霉素在生物样品中的超高效液相色谱串联质谱(UPLC-MS/MS)检测方法;在建立猪组织笼模型的基础上,研究了泰拉霉素在猪体内的药物动力学,考察了泰拉霉素在血清
河东碧梧桐所提出的“无中心论”突破了俳句的基本形式、固定化的季语等传统要素,引入了俳句创作主体“自我”这一概念,不但实现了俳句理论的创新而且对俳句的创作方法也产生了深远影响。“无中心论”中最重要的论点是“通过觉醒的自我对大自然进行动态地描写”,这也是对正冈子规的“写生说”旗下的“单纯写生”的强烈批判,彰显了河东碧梧桐不拘一格的俳句创作特征。本论文以河东碧梧桐的“无中心论”为主要研究对象,运用文献调