规则的信息量及其在数据挖掘中的应用

来源 :北京师范大学 | 被引量 : 0次 | 上传用户：iswhat

【摘要】

：

本文全面地讨论了清晰规则，模糊事件，模糊规则的信息量，并将这些新的度量公式成功地应用于数据挖掘。　　本文详细讨论了清晰规则信息量的度量，讨论了n元关系的信息熵及其相关性

【作者】

：

胡丹

【机构】

：

北京师范大学

【出处】

：

北京师范大学

【发表日期】

：

2005年期

【关键词】

：

数据挖掘关系信息熵规则信息量规则获取规则约简模糊事件

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文全面地讨论了清晰规则，模糊事件，模糊规则的信息量，并将这些新的度量公式成功地应用于数据挖掘。　　本文详细讨论了清晰规则信息量的度量，讨论了n元关系的信息熵及其相关性质，利用关系的信息熵给出了一个新的决策树学习算法。，回顾了与规则相关的诸多度量，我们发现，所有这些度量均孤立地讨论规则的前件与后件间的因果关系，忽略了规则本身存在于知识系统中，要全面度量规则的信息，便需将规则放回到知识系统中这一道理，提出了规则的条件信息量，规则的独立性，规则库的信息量，规则的泛化度等全新的概念，并分别给出了度量公式。这些概念都将在后面的章节中得到应用。　　本文给出了一系列关于最大泛化规则生成的算法，提出了两种新的规则提取算法，给出了一系列量度，以决定离散化过程中属性的顺序和节点的选择，并在此基础上给出了两种离散化算法，讨论了约简的信息内涵。　　本文集中讨论了模糊事件的信息量及模糊规则的信息量，给出了一种连续论域下比较模糊事件信息量的办法，讨论了规则的关联信息量，对可能性规则作出了新的定义，认为只有信息量为正的规则是可能性规则，而信息量为负的规则即使条件概率大于零也是不合理规则。基于信息的观点，我们对规则的置信度、规则中属性的可约性做出了新的定义，并进一步提出了新的规则提取算法LEI和规则约简算法LRR. 　　

其他文献

关于随机环境中可数马氏链的位势问题

　　本文是在Cogburn建立的随机环境中Markov链的数学模型的基础上，主要研究随机环境中可数Markov链的位势的几个相关问题。　　首先，本文讨论了随机环境中离散Markov链的禁忌

学位

随机环境可数马氏链随机调和函数随机位势函数禁忌概率

厦门进口废纸批次连续15个月同比增长

中国经济网2016-05-23报道:厦门海沧检验检疫局消息,2015年1月至2016年3月,海沧口岸进口废纸批次连续15个月同比增长。据资料显示,2015年1月至2016年2月,14个月份进口废纸的

期刊

进口废纸中国经济网厦门海沧纸品景兴纸业太阳纸业山鹰纸业晨鸣纸业沧口废纸价格

求解框形约束变分不等式的LQP算法

在求解非线性单调变分不等式问题的每一步迭代中，临近点算法（Proximal Point Algorithm）是求解一个子变分不等式问题，而LQP（Logarithmic-quadratic proximal）方法是求解一个非线性

学位

LQP方法单调算子变分不等式非线性单调变分不等式

关于串行程序并行性识别研究

　　20年来，并行编译技术的发展说明高性能并行编译系统与高性能体系结构和操作系统等一样，成了高性能计算机系统中不可或缺的一部分。而网络性能的迅速发展，给并行处理技术带来

学位

串行程序并行编译并行性识别并行化依赖关系分析

随机传染病模型和随机进化模型的动力学研究

本文主要研究了两个模型.首先研究了一个白噪声干扰下具有饱和增长率以及两种传染病交叉传染的随机传染病动力学模型.运用自治微分系统的相关理论、定性分析的方法,对具有饱

学位

随机传染病模型随机进化模型进化动力学种群竞争数值模拟

Convergence to equilibria for fluid models of multi type FIFO queueing networks

“Fluid models”是研究排队网络平衡稳定性的重要工具，它在分析何时这样的网络是运行稳定的以及在可能稳定的情形下如何判定其稳定性，定义一个一般性的原则中起着重要的作用。

学位

FIFO fluid熵函数排队网络网络平衡稳定性

努力做到三个贴近依法推进跨越发展

党的十六届三中全会是我们党在新世纪新阶段召开的一次十分重要的会议。认真学习贯彻全会精神,大力推进改革,努力加快发展,是摆在我们面前的一项重大任务。地方人大及其常委

期刊

解放思想思想高度体察民情高效生态经济社会事业存续企业黄河三角洲人民群众社会矛盾工作汇报

具不精确信息的函数及导数的最优恢复

本文简述了最优恢复问题的相关概念(参看文献【2】或【4】)。设C是线性空间X的子集，I是C到另一线性空间Y的映射，它可以是多值映射。本文在最后一部分我们研究了另一个最优

学位

函数导数最优恢复精确信息线性空间映射

重排不变函数空间中的鞅不等式

　　本文系统地考虑和研究了有限区间上重排不变函数空间框架下的鞅不等式和鞅空间。包括重排不变鞅空间及其中的Doob极大不等式，Burkholder-Gundy-Davis不等式，上、下不等式，Ro

学位

鞅不等式重排不变函数空间Boyd指数Hardy平均算子

善待音乐课上的“乱”

一直以来,音乐课容易乱,也常常乱,“乱”通常是指学生在音乐活动中做了与活动无关的事情,或者学生完全忘记了自我,不听从教师的活动安排,从而导致课堂陷入混乱,也影响了音乐

期刊

音乐课堂音乐活动教学学生教师活动安排学说调查

规则的信息量及其在数据挖掘中的应用

与本文相关的学术论文