基于兴趣度的判定树算法快速分类的优化

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:chenbin198718
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘在科研和商业应用中正发挥着越来越重要的作用。随着数据量的增加,数据挖掘工具处理海量数据的能力问题显得日益突出。数据挖掘通常又称数据库知识发现。为了系统的将数据挖掘技术应用与企业的决策,将企业的数据资源转换为企业的核心竞争力,一个有效的方法就是将数据挖掘技术与企业知识库技术有机地结合起来,形成分析研究和应用需求相互促进、知识与规则提取方法的专业化的应用体系。数据挖掘的基本任务是从海量数据中获取隐含在数据背后的有用的知识。数据挖掘应用基本过程是集成历史数据,在此基础上建立挖掘模型,挖掘出有价值的商业运作规律和模式,再将这些挖掘模型、规律和模式表示成易理解的规则集成到企业知识库中,最后是将知识库知识应用于企业的商业活动。不同的数据挖掘任务会产生出不同类型的知识。通过对这些知识类型结构和性质的研究,可以得到相应的数据挖掘过程需要完成的任务集合,从而定义出规范的、完整的数据挖掘算法流程。决策树学习有很多算法,本文着重研究了对引入用户兴趣度参数的ID3算法在面对多值属性时的快速分类的优化,在避免了多值弱相关属性覆盖少值强相关属性的基础上,通过数学工具简化原算法的复杂度和编码代价,从而提高使用该算法时的运算速度,尽量多的节约计算时间,从而达到降低成本的,提高效率的目的。
其他文献
优化技术是一种以数学为基础,用于求解各种工程问题优化解的应用技术。多年来,由于其广泛的应用而备受瞩目,并且发展迅速。随着应用领域的拓展,最优化问题的时空复杂性使其求解非
本文利用Hirota方法、Wronskian技巧和Pfaffian技巧研究了一些具有物理意义的孤立子方程,得出了它们相应的多孤子解。本文共分为四章: 在第一章中,简单综述了孤立了理论的发
信息通信技术及应用的高速发展使得关于密码学的应用无处不在,包括Internet账户、手机账户、银行卡、射频识别(RFID)卡等等。基于密码技术的重要性,密码学的专家和爱好者们不
本论文主要研究了带有齐次Dirichlet边界条件的两类非线性反应扩散系统解的性质,得到了系统解的局部存在性,解的整体存在和在有限时刻爆破的条件。 在绪论中介绍了本论文所
本文是在参与导师主持研究的国家自然科学基金资助项目“期货套期保值优化决策理论与模型的研究”(NO:70571010)、中期协联合研究计划(第二期)资助课题“中国期货市场交易风
在本文中,我们考虑了如下一类反应项由局部项和非局部项耦合而成的反应扩散方程组在齐次Dirichlet边界条件下解的爆破性质: 首先,我们研究了m=n=1时的反应扩散方程组。利用so