【摘 要】
:
随着信息技术的飞速发展,数据库应用的不断深化,数据挖掘已成为当今研究的热点。在数据挖掘的各个分支中,关联规则挖掘和分类挖掘是两个高度活跃的领域,其应用范围也非常广泛
论文部分内容阅读
随着信息技术的飞速发展,数据库应用的不断深化,数据挖掘已成为当今研究的热点。在数据挖掘的各个分支中,关联规则挖掘和分类挖掘是两个高度活跃的领域,其应用范围也非常广泛。关联规则和分类规则之间具有相似性。关联规则具有因果特性,关联规则的前件可以表示条件,关联规则的后件可以表示某种结果,当这种结果是类别时,关联规则就具有分类规则的特性,因此关联规则挖掘可与分类挖掘技术相结合。基于关联规则的分类方法就是这种结合的新产物。但传统的关联分类方法都是基于一般频繁项的,这类方法往往产生大量的类关联规则,且存在大量冗余的规则,不利于分类器建立和使用。对此,本文提出了一种新的关联分类法ACCF—基于频繁闭项集的关联分类算法。本文首先阐述了关联规则和分类挖掘的相关理论和算法;其次介绍了传统的关联分类算法CBA和CMAR;接着介绍了频繁闭项集的概念,及高效挖掘频繁闭项集的CHARM算法;最后详细论述了本文提出的新算法ACCF。ACCF算法基于频繁闭项集,这是因为频繁闭项集的数量远小于频繁项集,而且通过频繁闭项集能得到所有的频繁项集,通过频繁闭项集产生的关联规则能得到所有的规则。ACCF算法也对以往的规则修剪和匹配方法进行了改进。在对UCI数据库中的18组数据的试验表明,ACCF能挖掘出高质量且不丢失信息的规则,能减少类关联规则数量,在精确度上也高于具有代表性的传统关联分类算法—CBA算法。
其他文献
随着铁路的高速发展以及“互联网+”商业模式的快速推广,互联网已渗透到铁路客运的各个服务场景,铁路互联网用户呈现爆发式的增长,已经积累了大量的用户行为数据。通过用户的
无线传感器网络是一种特殊的无线通信网络,其节点具有感知能力、计算能力、通信能力,且不依赖于任何固定设施,是一种全新的信息采集和处理技术。它在诸如军事、交通、环境监
并行磁共振成像是一种利用多个接收线圈同时采集信号,减少相比使用单个线圈时所需的相位编码的次数,从而降低信号采集时间,加快成像速度的方法。其中SENSE是目前较为成熟和使
移动自组织网络(Mobile Ad Hoc Network),简称MANET,是一种基于AdHoc组网方式的新型的无线网络。MANET是一组带有无线通信装置的移动节点组成的自组织网络,不依赖于现有网络基础设
能源资源是一个国家国民经济发展的重要保证,以石油工业为代表的能源工业越来越受到世界各国的高度重视。信息技术的应用对于提高石油工业的勘探开发、数据采集及分析、经营
一切实际存在的系统都或多或少地具有非线性。有些非线性是系统固有的,有些则需要利用电子器件的非线性来达到要求。因此,对非线性系统进行深入地分析,并研究它的控制方法,具有十
随着信息化技术的发展,汽轮机向着复杂化和多样化方向发展,其建模可视化也变得愈加重要。目前,国产汽轮机建模可视化水平不高、交互操作性较差、依赖性较强,国外相关软件虽然
随着信息和网络技术的发展,图像等媒体信息的记录描述、存储和传输都在朝着数字化方向前进,高效的图像压缩传输越来越受到人们的关注,因此,图像压缩技术成为国际上热门的研究
Internet技术的飞速发展推动了流媒体直播系统的广泛应用。用户量也随之而加速增长,人们对视听的质量要求也越来越高,而传统的基于C/S模式的流媒体直播系统存在服务能力的瓶
随着嵌入式技术的不断发展,嵌入式数据采集系统被广泛应用在电信、工业控制、航空航天、电网监测、电子商务等领域。这些应用领域的共同点是数据具有很强的实时性,要求底层的