论文部分内容阅读
本文全面地讨论了清晰规则,模糊事件,模糊规则的信息量,并将这些新的度量公式成功地应用于数据挖掘。
本文详细讨论了清晰规则信息量的度量,讨论了n元关系的信息熵及其相关性质,利用关系的信息熵给出了一个新的决策树学习算法。,回顾了与规则相关的诸多度量,我们发现,所有这些度量均孤立地讨论规则的前件与后件间的因果关系,忽略了规则本身存在于知识系统中,要全面度量规则的信息,便需将规则放回到知识系统中这一道理,提出了规则的条件信息量,规则的独立性,规则库的信息量,规则的泛化度等全新的概念,并分别给出了度量公式。这些概念都将在后面的章节中得到应用。
本文给出了一系列关于最大泛化规则生成的算法,提出了两种新的规则提取算法,给出了一系列量度,以决定离散化过程中属性的顺序和节点的选择,并在此基础上给出了两种离散化算法,讨论了约简的信息内涵。
本文集中讨论了模糊事件的信息量及模糊规则的信息量,给出了一种连续论域下比较模糊事件信息量的办法,讨论了规则的关联信息量,对可能性规则作出了新的定义,认为只有信息量为正的规则是可能性规则,而信息量为负的规则即使条件概率大于零也是不合理规则。基于信息的观点,我们对规则的置信度、规则中属性的可约性做出了新的定义,并进一步提出了新的规则提取算法LEI和规则约简算法LRR.