【摘 要】
:
针对C4.5决策树算法在处理多维数据分类时,没有考虑各属性对分类结果的影响,导致分类准确率低的问题,提出一种基于距离权值的C4.5组合决策树算法。根据标准欧式距离定义数据
【机 构】
:
南京信息工程大学电子与信息工程学院
【基金项目】
:
国家自然科学基金项目(41575155)
论文部分内容阅读
针对C4.5决策树算法在处理多维数据分类时,没有考虑各属性对分类结果的影响,导致分类准确率低的问题,提出一种基于距离权值的C4.5组合决策树算法。根据标准欧式距离定义数据属性的距离权值,更新C4.5决策树算法的信息增益率,得到基于距离权值的C4.5算法。利用改进后的C4.5决策树分类算法训练多个基分类器,基分类器通过Bagging集成方法构建组合决策树。实验结果表明,该算法在处理多维数据时有较高的准确性和稳定性。
其他文献
目的探讨重复经颅磁刺激(TMS)对痉挛型脑瘫患儿痉挛及运动功能的影响。方法选取2013年2月—2015年2月徐州市儿童医院收治的痉挛型脑瘫患儿60例,按是否接受重复TMS治疗分为对
<正>上消化道出血是指屈氏韧带以上的消化道病变引起的出血及胃空肠吻合术后的空肠病变出血,是常见的急重症之一[1],属于中医呕血和吐血的范畴。在文献资料以及常规临床中,多
随着铁路集装箱保有量及铁路集装箱货运量的不断提升,铁路集装箱维修中的段换胶合木地板修理数量及修理费用也不断增加。通过分析铁路集装箱段换胶合木地板维修现状,研究其维
利用图形电磁计算方法,提出了针对高速运动目标电磁散射数据的仿真方法,以宽带线性调频信号为例仿真得到高速空间目标的电磁散射数据,并对宽带仿真数据进行逆合成孔径雷达(IS
目的研究多方位护理干预应用提高新生儿听力筛查质量上的效果。方法选取我院出生2 000例新生儿作为研究对象,将其平均分为参照组以及实验组,给予不同护理,对比两组的筛查通过
李汉荣是当代著名的散文作家,他善于从大自然中发现美,并用灵动的生花妙笔表达其对自然和生命的感悟。他的散文大多通过对美好生态的诗意勾画、对人与自然对峙现实的揭示以及
目的:探讨食管癌术后并发阵发性心房颤动的有效药物治疗方法。方法:选择食管癌剖胸术后新发阵发性房颤患者36例,随机分为毛花甙C+阿替洛尔组和胺碘酮组,前组静推毛花甙C后24
2013年10月,南京市考古研究所为配合板桥街道板桥市场群建设,对项目用地B地块进行了考古勘探。B地块占地12万平方米,地处张家洼、新凹子两个自然村,共发掘战国至清代墓葬17座
为了进一步提升铁路集装箱发效率,需要有关人员加快建立铁路集装箱物流中心管理信息系统,应用科学技术不断挖掘铁路集装箱运输潜力,提升铁路集装箱运输效率,从而促进我国铁路
对影响鹌鹑皮蛋品质的4个主要因素:A)NaOH浓度、B)食盐用量、C)茶叶用量、D)添加剂种类,进行4因素3水平正交试验设计研究。通过感官评定方法对影响皮蛋品质的因素水平进行优