基于随机森林特征选择的贝叶斯分类模型及应用

来源 :华北水利水电大学 | 被引量 : 0次 | 上传用户:ZXX198811
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯分析方法是研究不确定性的一种方法,并用概率的大小来表示其不确定性,基于此方法建立的分类模型具有可解释性、准确率高等优点,目前在许多领域得到了广泛应用.而随着我国经济的快速发展,信用评估也逐渐成为当前值得关注的话题之一.针对信用评估数据的特点,本文提出了基于随机森林特征选择的贝叶斯分类模型,并选取UCI数据库中的German数据集进行实证分析,结果表明:基于随机森林特征选择的思想,不但使得贝叶斯分类模型的结构更加简单,而且其获得的分类效果更优.本文主要的工作和创新如下:(1)随机森林是一种能容忍噪声且稳定性较高的智能学习算法,基于此算法的特征选择可以进行特征变量筛选,删除其冗余不相关的特征属性,又考虑到具有良好分类效果的朴素贝叶斯模型,本文构建了基于随机森林特征选择的朴素贝叶斯分类模型(RF-NB).(2)在实际应用中,考虑到朴素贝叶斯的“独立性假设”往往不成立,为使模型更符合实际,树增强朴素贝叶斯模型可以更好的表示特征属性间存在的依赖关系,因此本文又构建了基于随机森林特征选择的树增强朴素贝叶斯分类模型(RF-TAN).(3)将基于随机森林特征选择的贝叶斯分类模型应用到German数据信用评估指导中去,用于验证所提出的RF-NB和RF-TAN分类模型的分类效果,并与未进行特征选择的NB模型和未进行特征选择的TAN模型进行实验对比.实验结果表明:RF-NB和RF-TAN模型的分类效果显然优于NB、TAN模型.
其他文献
本文第一部分主要研究星体上的凸几何不等式.首先给出了若干新的星体不等式,在定义了新的星体弦长积分后,继而得到了星体的弦对称体和相交体的若干不等式.并对一个已知均质积分
进入21世纪以来,数字几何处理研究取得了飞速的发展,无论是在学术界还是工业界都引起了足够的重视.数字几何处理是研究如何在计算机中处理三维几何数据的技术.而三维网格分割是其
本文主要研究网络上的微分方程耦合系统的稳定性问题。现实世界的许多现象,如生物和人工神经网络,格子上的非线性振子耦系统,复杂生态系统,以及传染病在异质人群中的传播,都
试验设计在科学研究和实践中都起着重要的作用,它已广泛应用于农业、化工、医药以及一些高科技产品的研发与制造.   Wu and Hamada(2000)将试验的问题依据其研究对象分为五
为了创新大豆品种和探讨育种技术,本研究通过空间诱变有性杂交F2,采用系谱选育方法,育成大豆新品种克山1号。该品种油分含量21.82%,蛋白质含量38.04%,2007-2008年参加国家早
本文的主要内容有以下三个部分.   1.秩约束下矩阵方程的极秩和秩约束条件下矩阵方程的最小二乘解   首先我们给出秩约束条件r(X)=k下r(A-BX)的极小值;其次给出秩约束条件
对于无约束优化问题而言,信赖域方法是一类很有效的数值办法.信赖域方法思想新颖,算法可靠,具有很强的收敛性.不仅可以很快的解决良态问题,而且可以有效的求解病态问题,从而
final关键字在java中的应用至关重要.使用final关键字可以使JVM优化变量、方法和类,在多线程环境下,可以进行安全的共享,减少了同步开销.本文结合简单实例对final关键字在变
审核是指按PDCA(计划、执行、检查和行动)循环的思想,对管理体系的符合性、有效性和适宜性进行客观评价,以确定其满足审核准则的程度所进行的系统的、独立的并形成文件的过程。
本文采用了内蒙古地区2000年5月1日~5月4日的NCEP再分析资料风场数据,通过数值实验来模拟二维和三维沙尘输送模型的沙尘输送过程,并研究了二维输送模型对初值和参数Kph的敏感