基于决策树方法的非平衡问题数值分析与算法改进

来源 :厦门大学 | 被引量 : 0次 | 上传用户:pigdun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非平衡问题在数据科学研究中广泛存在,对于此类问题人们往往较为关心小类被分对的概率。本文旨在研究不同因素对决策树分类效果的影响,以及如何对决策树算法进行改进,提升其在非平衡问题中的表现。通过决策树算法和K-近邻算法的有机结合,本文构造出了一个新的算法—LRDT算法(Leaf Rank Decision Tree)。LRDT算法的核心在于根据合适的指标对决策树中的大类叶子进行排序,通过优先处理表现不好的叶子来提高小类的准确率。该算法缓解了非平衡问题中决策树为了保证整体准确率偏向大类,导致小类被埋没的问题,在提高小类准确率的同时未损失整体的准确率。
其他文献
通过反思我国刑事诉讼所坚持的实体真实主义理论模型的不足,借鉴在两大法系刑事诉讼中有关真实的相关理念的转变。我国有必要放弃实体真实主义,转而坚持相对实体真实主义。作
波形钢腹板箱梁桥是一种新型钢-混组合箱梁桥,是用波形钢腹板取代混凝土腹板的一种箱梁桥。这种新型箱梁结构具有更好的力学特性和优点:自重较轻、耐久性强、腹板抗剪切能力强、造型美观、施工方便。随着波形钢腹板箱梁桥的广泛推广应用,国内外学者对这种结构进行了大量动静力学方面的研究,但是对其桥面铺装动力学方面的研究一直处于滞后状态。随着我国科学技术和国民经济的迅猛发展,超重和超载的现象日益严重,使得桥面铺装层
随着信息时代的到来,人类生活与信息资源密不可分,信息化的重要性也在与日俱增。高校作为庞大的科研机构,科研管理的信息化应用实现变得愈发重要,因此相关科研系统的完善可以
随着中国综合国力不断增强,中国人学习西方优秀文化和前沿知识的需求日益增长,国内越来越多高校从国外聘请优秀教师为学生授课。然而,考虑到非英语专业学生的语言水平欠缺,短
动产责任转质在我国民间债权关系中时有发生,而我国对该制度的态度颇为暧昧。时至今日,理论界和司法实务界对我国动产责任转质制度的法律适用仍然争议不断,所以明确该制度的
当今世界,一个国家的综合国力在很大程度上是由其工业发展水平决定的。而在工业发展中,能源资源则扮演着关键性角色。缺少能源,工业根本就无法正常发展。因此,为了保持经济高
零件表面的疲劳损伤通常是由于制造过程中产生的表面缺陷和来自表面形貌产生的应力集中所引起的,工程构件的疲劳强度随着表面粗糙度的降低而增大。本文将从表面应力集中的角度研究表面粗糙度对铝合金疲劳寿命的影响。本文主要研究内容如下:(1)仿真研究了表面微缺口特性对应力集中系数的影响。将表面粗糙度简化为一系列椭圆形微缺口,考虑的微缺口参数包括凹痕深度b、宽深比(6/(7与多缺口中心间距d。分别研究了单、多微缺
随着常规能源的日益枯竭,我国已开始对可再生能源进行开发和利用,旨在达到混合可再生能源系统最新发展水平。与此同时,西方国家对于混合可再生能源利用已十分成熟,借鉴他国先
优先股是特别股的一种类型,最明显的特点是通过让渡对公司的经营管理权来换取公司分红和清算时相对于一般股份的优先顺序。根据对优先股不同层面的权利义务内容的划分标准,优
塔冠作为超高层建筑顶部上的一种围护结构,功能及形状各异。随着超高层建筑高度的增加,塔冠本身的高度也达到了30m以上。风荷载是超高层建筑设计中的控制荷载,也是限制超高层建筑高度发展的重要因素之一,塔冠上的风荷载作用在超高层建筑顶部,对结构整体风荷载和风致响应的影响较大,因此通过对结构外形的小的改变来减小风荷载或者风致振动的方式成为了超高层建筑抗风设计的研究方向之一。本文利用高频测力天平技术,在大气边