具有数量单调约束的多变量决策树分类算法

来源 :大连海事大学 | 被引量 : 1次 | 上传用户:shifter_2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
决策树是一种以智能化方式进行实例分类的数据挖掘方法,已被广泛应用于人工智能等领域。其中单调分类算法可以解决属性和标签值具有单调序关系的分类问题。单调序关系是指在分类的过程中对属性和标签存在的一种单调约束,即当属性值增加时,类标签值应该不变或是相应地增加。这种分类问题在客户信用等级评估等领域广泛存在。然而以往的实验表明使用传统单调分类算法通常对噪声数据比较敏感并且对数据集的种类有一定的限制。为了解决上述问题,本文提出了一种以数据集的分布情况为依据的决策树分类算法。首先根据非同类数量比指标对原始数据集进行降噪,减少噪声样本对分类结果的影响,以此提高分类准确率。其次由于传统的单调分类方法仅适用于属性和标签都为有序值的数据集,且形成的单变量决策树无法综合考虑所有属性对分类任务的影响率,所以本文将数据集映射到多维空间中,并结合局部密度峰值聚类的方法形成具有数量单调约束的单调分类,从而演化成一棵多变量决策树,该方法不仅可消除对数据集种类的限制因素,还能够将所有属性的影响纳入分类过程。最后通过相对边界点与局部错分率之和两个方法确定最佳分裂超平面对数据进行分类。在实验方面,本文将提出的具有数量单调约束的多变量决策树分类算法应用于从UCI中选取的1 1个数据集。同时将本文提出的多变量决策树分类算法与决策树算法中的ID3决策树分类算法(REPTree)、C4.5决策树分类算法(J48)、随机森林算法(RandomForest)、随机树算法(RandomTree)和霍夫丁树算法(HoeffdingTree)分别进行了实验对比。实验结果表明,本文提出的分类算法在分类准确率、平均绝对误差及F1-Measure等指标方面优于其他决策树分类算法,具有良好的分类性能。
其他文献
清选装置在玉米籽粒收获时扮演着重要的角色,清选装置筛面结构和工作性能直接决定着玉米籽粒收获的质量。谷物清选装置按工作原理分为气流式和风筛式两类,由于风筛式清选装置可以对脱出物进行较好的输送,因此在玉米收获中风筛式清选装置的应用最为广泛。风筛式清选装置利用风机产生的气流场使玉米脱出物分散,并带走部分轻杂余,其余混合物在筛面振动作用下分散、分层,使玉米籽粒透筛而杂余排出。目前学者对清选装置的研究中,多
目的 探究肺炎克雷伯菌转录调控子RcsAB对荚膜多糖表型的影响及对荚膜多糖相关基因galF的调控机制。方法 将肺炎克雷伯菌NTUH-K2044的野生株与rcsA、rcsB、rcsAB的敲除株和回
在幼儿交往过程中同伴冲突是不可避免的,它是儿童之间经常发生的一种重要的社会交往形式。研究者对幼儿同伴冲突大量的研究越来越肯定幼儿同伴冲突的正向功能,并努力地把冲突
少数民族地区的扶贫工作是我国“精准扶贫”工作的重点区域,少数民族地区的攻坚脱贫工作成效关乎着全面建成小康社会这个百年梦想的实现。内蒙古鄂温克旗属于自治区贫困县,作
目的:临床上经核苷(酸)类似物(NAs)治疗的慢性乙型病毒(hepatitis B virus,HBV)感染患者可发生HBV RT区耐药相关突变,其中rtA181T突变可同时引起与RT基因重叠的S基因突变。本
学位
我国房地产行业经历了从2003年到2017年房价连续14年只涨不跌的黄金时期,在现行的产业系统中,房地产行业占据着举足轻重的地位。然而,房地产行业是一个资本密集型行业,对资金的需求是巨大的。房地产项目开发周期长,资金投入时间成本高。房地产开发公司不可能只靠自己的资金来完成项目开发。近两年,房地产行业深受市场变化、政策变化等因素的影响,中小房企利润被土地、资金成本压缩,甚至造成开发停滞、产品滞销,从
村镇银行是农村金融改革和发展的生力军,只有具备盈利能力才能具备立足农村金融市场的活力,并为发展与开发市场奠定基础,从而为农村的发展提供持续的资金支持,使得金融的“政
玉米秸秆是一种丰富的生物资源,我国每年产量约3亿吨,位居世界之首。秸秆切碎装置是玉米联合收获机的重要辅助工作部件,它的主要作用是对玉米秸秆进行切碎还田,其结构和运动参数是影响装置对秸秆切碎效果的主要因素,本文对现有某一进口玉米联合收获机秸秆切碎装置进行田间试验,发现秸秆切断长度合格率低的问题,结合当前玉米机械化收获作业的实际需求,对其进行台架试验及参数优化,提高秸秆切断长度合格率及破碎率。研究主要
风险资本是一种通过私募形式投入新兴且非上市企业的权益性资本,其主要盈利模式是通过公开发行上市(IPO)、出售或兼并(M&A)、清算以及破产等方式实现退出从而获得收益。作为