一种特征值区间划分的模型决策树加速算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:laijacky1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前对决策树(Decision Tree,DT)分类问题的相关研究已取得了很多成果,但仍存在一些问题,如决策树在寻找最优切分点时需要遍历特征的所有取值,当数据集规模较大时,递归构建决策树所需时间将会很长,因此在保证分类精度的前提下加速决策树的构建具有重要意义.本文首先根据数据的不同分布,给出两种特征值区间的分割方法,即等精度特征值区间划分和变精度特征值区间划分,然后计算各选定区间的基尼指数,寻找最优特征及最优切分点,最后递归生成模型决策树.实验表明,算法在构造决策树时可有效减小计算代价,在保证分类精度的同时加速决策树的构造,且在一定程度上能够避免过拟合现象的发生.
其他文献
The dielectric capacitor has been widely used in advanced electronic and electrical power systems due to its capability of ultrafast charging–discharging and u
High-thermally conductive AlN-based microwave attenuating composite ceramics with spherical graphite (SG) as the attenuating agent were fabricated through hot-p
Photocatalysts with the photocatalytic “memory” effect could resolve the intrinsic activity loss of traditional photocatalysts when the light illumination is
风电机组传感器受环境干扰,导致采集的信号存在差异,从而对风电机轴承的故障诊断结果产生影响。为提高故障诊断的可靠性,提出一种多源信号故障诊断方法。提取轴承振动信号、噪声信号、温度信号的时域、频域特征作为故障特征,利用经贝叶斯优化算法优化隐藏层节点结构的堆叠降噪自编码器对故障特征进行融合,采用Softmax对融合的故障特征进行分类。实验表明:该方法的故障准确率比单一信号进行故障诊断的方法更高,并且混合
The Mn1.95-xCo0.21Ni0.84SrxO4 (MCNS) (0 ≤ x ≤ 0.15) based negative temperature coefficient (NTC) materials are prepared by co-precipitation method. The replac
冲击对系统可靠性产生一定影响,而如何量化冲击载荷的影响程度成为系统可靠性分析的关键。在退化失效与突发失效竞争的基础上,研究系统受到不同冲击强度影响下的可靠性模型精度问题。在失效阈值可变的情况下,以极值冲击描述冲击过程,Wiener过程描述两类失效的退化过程。针对不同强度冲击对系统的影响下,考虑对冲击进行载荷区域的划分,建立两类失效过程的分布函数,提出了系统竞争失效的可靠度模型。结合Sandia微引
Lead-free Na0.5Bi0.5TiO3 (NBT) ceramics were prepared via a conventional oxide-mixed sintering route and their electrical transport properties were investigated
A quasi-solid-state lithium battery is assembled by plasma sprayed amorphous Li4Ti5O12 (LTO) electrode and ceramic/polymer composite electrolyte with a little l
针对大排量摩托车中高速行驶时前悬架系统摆振(wobble)和后悬架系统迂回摆动(weave)的综合问题,提出一种基于灵敏度分析和近似建模的多目标优化方案。建立摩托车模型并完成动力学仿真,以表征摆振和迂回摆动的前轮质心位置侧向加速度、整车质心位置横摆角速度和侧倾角速度为目标,对悬架系统参数进行灵敏度分析和近似建模,基于分析结果完成悬架系统参数的多目标优化,并利用根轨迹法对优化结果进行验证。结果表明,
为充分发挥电价对市场的调节作用,考虑用户对实时电价响应行为的差异性,将用户分为短期用户、混合用户和长期用户,基于电量电价弹性矩阵构造了3类用户的实时电价模型。在此基础上,建立了一种基于用户对实时电价响应行为的源荷协调日前调度模型。借助MATPOWER中的MOST工具包和Mosek求解器,算例分析在一个修改IEEE7机57节点系统中展开,与传统经济调度模型的比较结果证明了所提模型的有效性。此外,分析