基于分解数据库的FP-growth算法关联规则研究

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:ydaf4rx3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
论文针对频繁模式增长算法(FP-growth)中存在的频繁模式树(FP-tree)占据空间过大等问题,提出了一种改进的FP-growth算法,该算法采用分解数据库思想对事务数据库进行分类后分别挖掘以提高算法效率,并在提取规则时增加约束条件以更好地适用于所研究的医疗数据。实验结果表明,该算法的计算效率、产生的关联规则数量方面的性能明显优于经典的Apriori算法和FP-growth算法。通过对糖尿病以及它的三种主要并发症的关联规则的研究,获得糖尿病主要并发症发病概率定量关系(高血压>高脂血症>冠心病)以及肥胖增大患糖尿病并发症概率的规则,对于糖尿病并发症的前期预防有一定参考价值。
其他文献
研究含风电场的电力系统短期经济调度问题,针对风电的随机性和波动性对调度的影响,建立了考虑备用成本的电力系统短期调度模型,充分考虑到系统运行经济性,模型中引入了一种特殊旋
随着我国诉讼法学领域证据问题研究的深入,程序价值的意义被凸显出来.正义观念的重要性包含两个方面的内容,即实体正义和程序正义.在两种不同性质的正义观念中寻求一种平衡,
国民待遇原则是WTO各成员方共同遵循的非歧视原则。但国民待遇原则在GATT货物贸易和GATS服务贸易中的适用不同 ,主要表现在普遍义务与特定义务、无条件与有条件、无限制与有
以TI的16位低功耗单片机MSP430F149为核心实现对分界负荷开关的自动控制,介绍了用户分界负荷开关控制器的软件和硬件设计实现,测试结果表明:本设计完全实现用户分界负荷开关的控