【摘 要】
:
数据挖掘 (DM)是非常具有挑战性的工作 ,数据挖掘过程是多个因素耦合的决策问题。讨论了当前流行的DM过程CRISP DM和SEMMA的不同之处及优缺点。从机器学习、统计和数据质量角
论文部分内容阅读
数据挖掘 (DM)是非常具有挑战性的工作 ,数据挖掘过程是多个因素耦合的决策问题。讨论了当前流行的DM过程CRISP DM和SEMMA的不同之处及优缺点。从机器学习、统计和数据质量角度对挖掘有效性作了讨论 ,认为一个真正高效的过程应该面向算法 ,强调探索 ,以挖掘出高可靠性的具有商业价值的知识目标 ,并紧跟技术的发展。给出数据挖掘过程的多维视图 ,将算法分解为组件维、模型维和过程维等维度 ,以此提出新的DM过程的框架
其他文献
本文展开对气相色谱在有机氯、有机磷农药检测中的实际应用分析研究,其主要目的在于了解当前气相色谱的具体方法,以及其在农药检测中的实际应用现状。自改革开放不断深入实施
半导体硅片退火工艺对生产硅片具有十分重要的作用,为此,本文加强对硅片的退火技术检测,希望能够控制硅片技术质量。因为自然界当中并不存在单体硅,硅主要以氧化物或者是硅酸
<正>女大学生就业难已经是一个不争的事实,其原因众说纷纭。抛开中国整体就业形势严峻这个大背景不谈,最根本的原因恐怕还在于传统社会的女性角色定位导致女性相对于男性会投
从标准中的基本概念出发,讨论了电气间隙和爬电距离在概念上的异同,分析了影响这两个参数的主要因素并详述了测试过程的原理。根据测试实例分析了电气间隙和爬电距离在实际测
黑水虻Hermetia illucens(L.)是一种重要的资源昆虫。本文旨在筛选出适合黑水虻血细胞观察的染色方法,明确黑水虻血细胞类型、数量及组成,为黑水虻血细胞免疫研究奠定基础。采
目的:探讨母亲惩罚严厉和抑郁症状的关系,进一步分析心理弹性在母亲惩罚严厉与成年早期抑郁症状之间的调节作用。方法:采用父母教养方式评价量表、心理弹性量表、汉密尔顿抑
以马远、夏圭为代表的南宋院体山水画统治了南宋一百多年,并形成了"马夏"画派。本文主要对"马夏"绘画风格(即构图布局和笔墨特性)进行分析比较,并通过传世代表作加以明证,辨
<正>语言是教学思想的直接体现,课堂教学过程就是知识的传递过程。在整个课堂教学过程中,知识的传递、学生接受知识情况的反馈、师生间的情感交流等,都必须依靠教学语言。作
目的观察丙种球蛋白治疗重症手足口病的临床疗效。方法选取86例重症手足口病患儿,随机将86例患儿分为观察组和对照组,各43例。2组患儿均采取利巴韦林+甲泼尼松龙治疗,对照组
本文首先收集1985—2006年中国28个省市数据验证中国区域经济增长的条件β收敛和绝对β收敛,然后运用Blinder—Oaxaca分解方法来分析造成我国东部地区与中西部地区发展差距的