基尼指数相关论文
AdaBoost算法是一种将多个基学习器通过合理策略结合生成强学习器的集成算法,其性能取决于基学习器的准确率和多样性。但弱学习器......
期刊
介绍了机器学习的背景、及决策树的基本概念、决策树学习的基本过程,以及其中最重要的特征选择的依据:信息增益和基尼指数,重点研究了......
质量控制图作为一种统计管理工具,在工业质量管理上的重要性愈发明显,它是一种由横纵坐标和上下界限构成的统计图,通过图上的打点......
以地级市及以上城市为研究单元,运用基尼模型测算我国27个省级行政单位的城市规模基尼指数和城市经济基尼指数,通过商值法计算基尼......
摘要:目前,全球粮食系统以低成本、高效率的方式生产和分配粮食。尽管如此,粮食系统生产的粮食仍然难以养活每个人,而且还对环境造成不......
目前对决策树(Decision Tree,DT)分类问题的相关研究已取得了很多成果,但仍存在一些问题,如决策树在寻找最优切分点时需要遍历特征......
本文利用对比较分析法,从二元经济的调节、初次分配和收入再分配三个方面分析了日本在经济高速增长时期仍能保持低基尼指数的原因。......
报载:与去年十一月相比,中国今年十一月的物价指数上升了6.9%,是1996以来最高的。曾经说过,因为人民币兑美元上升了10%,今天的通胀其实......
随着基础理论研究所取得的一系列进展,分布估计算法逐渐成为进化计算研究领域的一个新的研究方向,并成为当今国际进化算法研究的新......
无论利用何种决策树算法,在构造决策树的过程中最关键的问题是确定每个节点的最优分支属性,以及相应属性的最佳分割点.本文分析了......
本文以基尼系数代表贫富差距水平,以GDP代表经济水平,运用spearman相关系数分析各国贫富差距与经济水平的关系,而后又运用聚类分析......
目前,关于n-grams特征加权的计算方法大多是基于其出现频率进行设计的。这类加权计算方式存在一定的问题:n-grams特征是由多个词汇......
文本自动分类中特征选择和加权的目的是为了降低文本特征空间维数、去除噪音和提高分类精度。传统的特征选择方案筛选出的特征往往......
通过对SPRINT、RAINFOREST等传统决策树算法改进,使其能够适应不断生长的训练集,生成一棵与旧树相关的树;改进后的算法,新样本一来即可......
随着网上信息的极大丰富,文本分类技术显得越发重要,且预处理技术已成为文本分类的瓶颈.在预处理中采用TF-IDF算法,并且根据基尼指......
使用基尼指数原理进行了文本特征选择的研究,构造了基于基尼指数的适合于文本特征选择的评估函数。结合fkNN和SVM两种不同的分类方......
介绍了决策树分类技术,并用其对汽车销售企业的调查问卷进行数据分析,挖掘出最近一年内有购车意愿的客户的特征,从而提高营销的成......
为了刻画山东省城市规模分布特点,以市区非农业人口作为城市规模的特征量,选取山东省建制城市1990—2008年的相关数据,采用首位度......
随着网络技术的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术。常采用向量空间模型来表示文本,将文本看作特征空间的一......
本文以基尼系数代表贫富差距水平,以GDP代表经济水平,运用spearman相关系数分析各国贫富差距与经济水平的关系,而后又运用聚类分析......
通过对不同类型车间作业调度问题的描述,分析各类问题之间的共性特征,提出了一种基于基尼指数的遗传算法.该算法结合进化生态学和决策......
目的分析武汉市卫生资源配置的公平性,为优化区域卫生资源配置提供依据。方法采用基尼系数和泰尔指数分析2005年、2009年和2013年......
我国在发展经济的过程中,贫富差距问题一直受到广泛关注。经济学家们为解决该问题提出了很多方案,政府相关部门也出台了相应的对策......
双目标CD-CAT的测验结果既可用于形成性评估也可用于终结性评估。基尼指数可度量随机变量的不确定性程度,值越小则随机变量的不确......
随着网络的发展,大量的文档数据涌现在网上,用于处理海量数据的自动文本分类技术变得越来越重要,己逐渐成为处理和组织大量文档数据的......
目的:探讨发展中国家经济发展对全民健康及医疗保障制度的影响。方法:对10个发展中国家2003—2011年的经济、健康官方数据进行回顾......
目的:本研究将透过收集患者资料和血液标本,通过随机森林算法构建筛查阻塞型睡眠呼吸暂停低通气综合征(obstructive sleep apnea-h......
信息时代的快速发展使得数据的采集、传输变得更加容易,数据规模也呈现指数式增长的趋势。这样庞大的数据中蕴藏着巨大的价值,所以......
超高维数据的收集与存储,因科学技术的飞速发展已不再是问题.那么随之就面临着如何分析此类数据的困难.众所周知,超高维数据,即数......
近几年许多行业都步入大数据时代,但数据挖掘技术在我国保险领域的应用相对不多,并且我国保险公司也要考虑通过改变传统的经营方法......
对长三角、珠三角和京津冀等十大城市群进行实证分析.引入基尼模型计算城市规模基尼指数和城市经济基尼指数,求出基尼商指数判断其......
中枢辐射式航线网络被美国、欧洲和中国主要航空公司广泛采用,但如何评价此类航线网络的运营质量和效率,国内还很少有相关研究。本......
本文通过对草地群落物种数比例与生物量比例之间的关系研究,建立了草地群落植物种等级划分的方法,验证了该方法的合理性;并首次用......
密度峰值聚类算法(Density Peaks Clustering,DPC),是一种基于密度的聚类算法,该算法具有不需要指定聚类参数,能够发现非球状簇等......
决策树算法采用递归方法构建,训练效率较低,过度分类的决策树可能产生过拟合现象.因此,文中提出模型决策树算法.首先在训练数据集......
随着Web技术的高速发展,各种互联网络上的信息也正以爆炸性的速度飞速增长,如何从这个蕴涵庞大信息量的数据集合中有效抽取有用的......
随着网络的发展,大量的文档数据涌现在网上,用于处理海量数据的自动文本分类技术变得越来越重要,自动文本分类已成为处理和组织大量文......
文本分类中普遍应用的TF-IDF特征权重算法没有引入特征项的纯度和类别属性.在结合基尼指数原理和TF-IDF特征权重算法基础上,提出一......
使用基尼指数原理的“纯度”形式,结合类内频率的思想,构造了一个适合特征选择的特征评估函数GGNI(Category Gini—index),在特征维数取......
随机森林(RF)具有抗噪能力强,预测准确率高,能够处理高维数据等优点,因此在机器学习领域得到了广泛的应用。模型决策树(MDT)是一种......
为提高智能模型的识别精度,增强其泛化能力,需要对用于智能建模的数据集中的对象类别异常进行检测和修 正.在进行数据集和决策树形......
决策树是数据挖掘中的一个重要算法。文中首先介绍了决策树的生成思想,和生成过程中关于多值属性的分离问题。基尼指数是多值属性......