基于决策树和信息熵的属性约简算法研究

被引量 : 7次 | 上传用户:ytmbg163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是一种快速的、高效的、智能的数据分析方法,用于发现大量数据背后隐含的信息。粗糙集理论作为一种处理不确定和不精确性问题的新的数学工具,已广泛应用于数据挖掘领域,该理论不需要任何先验知识并且能够简化输入信息的表达空间。属性约简要求在保持知识库的分类能力不变的条件下,删除其中不必要的属性,形成精简的规则库以帮助人们做出正确的决策。寻求高效的属性约简算法是粗糙集理论的主要研究内容,在数据挖掘领域具有重要意义。本文提出了一种基于变精度粗糙集的决策树构造算法和一种基于自适应粒子群和信息熵的属性约简算法。一是在变精度粗糙集理论的基础上,提出的一种利用新的启发式函数构造决策树的算法。该算法把变精度加权平均粗糙度作为分类属性的选择标准,在决策树构造中用确切的置信度标记决策树的规则,使得到的决策规则更易理解,且相应的算法应用MATLAB程序进行实现,并通过实例说明所给算法的有效性。二是在分析模糊粗糙集的基础上,提出的一种基于自适应粒子群和信息熵的属性约简算法。利用基于自适应粒子群的模糊C均值聚类算法进行聚类分析,将聚类得到的属性隶属矩阵用于属性约简,并提出了一种基于自适应粒子群和信息熵的属性约简算法,通过实例验证该算法的可行性。
其他文献
非线性发展方程解的爆破理论是偏微分方程的重要内容。在本文第二章中,我们首先研究了一类带有反平方势函数的半线性热方程:ut=△u-V(x)u+a(x)Up在非局部非线性边界条件:u=∫ΩK
改革开放以来特别是党的十六大以来,我国非公有制经济迅速发展,非公有制经济组织党建工作面临新的形势和挑战。非公有制经济组织党建工作在长期的探索实践中,积累了不少成功
1960年,Erd(o)s和Moser提出在一般n阶无向图G中求极大独立集个数的最大值,以及何时达到最大值的问题.Erd(o)s解决了这个问题,随后,Moon和Moser也独立的给出了这个问题的相关
学位
本文围绕常微分算子领域中的不同微分算子谱之间的关系、数值计算以及具有内部不连续点的微分算子的谱分析等三个方面开展研究工作. 不同微分算子谱之间的关系是Sturm-Lio
期刊
英语作为最重要的信息载体之一,已成为人类生活各个领域中使用最广泛的语言.因此我国在基础教育发展战略中,已经把英语教育作为素质教育的重要组成部分.所以教师在小学英语的
期刊
图G的一个正常k染色是指一个映射φ:V→{1,…,K),使得对任意uv∈E(G),有φ(u)≠φ(v).若图G有一个正常k染色,则称图G是k可染的.   设G=(V,E),给G的每个顶点v∈V(G)分配一
学位
本文研究一类含p-Laplace算子的合作反应扩散模型,即一类具有互惠关系的种群在一定区域内的变化趋势。自Shigesada等人给出了两种群的反应扩散模型以后,种群动力学的相应理论得
N.I.M.Gould,C.Sainvitu和Ph.L.Toint将过滤集技术推广到无约束优化问题上.以此为基础,缪卫华提出了一种新的无需判断信赖域子问题凸性的方法.本文采用了非单调信赖域方法,并