最大频繁项集相关论文
随着网络资源的不断丰富和网络信息量的不断膨胀,信息过载和资源迷向已经成为制约人们高效使用Web信息的瓶颈。网站需要引入一种能......
随着信息技术的快速发展,许多领域中每天都不断产生大量的数据,如传感器网络中传输的各种数据等。这些产生的海量数据很多都是以不......
入侵检测是网络安全领域中的一个重要发展方向。入侵特征库在传统上是由专家根据已发生的入侵行为手工编制而成,它具有快速检测已......
近来研究的热点主要集中在如何缩小搜索空间使得频繁项集挖掘算法更有效。在这篇文章中提出了一种新的搜索空间剪枝技术NTEP,这......
随着数据库技术的飞速发展以及数据库管理系统的广泛应用,各个企业和部门通过自己的数据库管理系统,经过长年努力,已经积累了越来越多......
海量数据的存在,从海量数据中提取信息的应用需求,以及信息对企业战略决策的影响,使得数据挖掘无论是理论研究还是应用实践都是有......
关联规则挖掘经过十几年的发展,取得了丰硕成果。其中的布尔关联规则挖掘是关联规则挖掘中研究比较多的一种。通过数据离散化和符号......
数据挖掘是指从大量数据中提取或“挖掘”知识。关联规则是数据挖掘当前研究的主要模式之一,用于确定数据集中不同域或属性之间的......
随着网络信息的爆炸式增长,如何帮助用户快速准确地定位所需信息就成了一个十分紧要的问题。通过对搜索引擎查询结果进行在线聚类......
数据挖掘是指从大量的、不完全地、有噪声的、模糊的、随机的数据中提取人们感兴趣的知识和规则的过程,数据挖掘的研究已经取得了重......
数据挖掘是计算机科学的一个领域,目的是通过分析快速增长的商业、科学和工程数据来获取知识和其他利益,这个领域正在迅猛增长和发......
数据流模型是近年来出现的、一种新型的数据模型,广泛应用于网络监测、传感器网络数据分析、Web点击数据流分析、金融行业和商业交......
关联规则挖掘过程中频繁项集(Frequent Itemset,FI)的求解是关联规则挖掘的基础和前提,也是关联规则挖掘中最耗时的一步。降低候选......
随着网络技术的发展,网络信息正在以几何级速度迅速膨胀。如何通过信息融合进行在线信息的处理,特别是进行数据量巨大的文本信息处......
随着信息产业尤其是互联网行业的高速发展,使得人们获取和存储数据的能力不断提高,数据库中存储的数据以指数形式不断增长。但在这......
最大频繁项集挖掘是数据挖掘重要研究方向,它以频繁项集簇的最简集合形式反映事务数据集项间的关联关系,具有重要的理论研究价值与......
相对于频繁项集,最大频繁项集的数目较少,挖掘最大频繁项集的算法具有较高的时空效率。提出了一种新的基于文法顺序FP-Tree的最大......
期刊
通过对Apriori算法基本思想的研究,针对Apriori算法的一些不足之处提出了一种改进的关联规则挖掘算法.算法通过布尔矩阵的位与运算......
频繁项集的挖掘是数据挖掘中的一个基础和核心问题,具有广泛的应用领域。由于它是数据挖掘过程中最耗时的部分,挖掘算法的好坏直接影......
针对目前海量数据挖掘过程中存在着频繁项集挖掘效率低、冗余项集繁多的问题,提出了改进的频繁模式树和遗传算法(FPGA),该算法鉴于异......
鉴于高维数据的稀疏性和分类数据特点,探讨了专门针对高维分类数据的聚类方法.首先将原始数据集转换成频繁项集,再通过改造频繁模式树......
频繁项集挖掘是关联规则挖掘的核心内容,提出了一种挖掘最大频繁项集的并行算法CDTR。它对CD(counting distribution)算法进行了改......
针对相关算法在挖掘数据流最大频繁项集时所存在的问题,提出了一种基于向量的数据流滑动窗口中最大频繁项集挖掘算法。该算法首先......
系统地介绍了最大频繁项集的增量式更新问题,提出最大频繁项目集更新算法FUMFS,并举例说明了算法的执行过程。该算法充分利用已建......
为解决P2P网络频繁项集挖掘中存在的全体频繁项集数量过多和网络通信开销较大这两个问题,提出了一种在P2P网络中挖掘最大频繁项集......
为了提高挖掘的效率和精度,采用代数定义最大频繁项集并建立其数学模型,通过二进制编码将支持度的计算、蚁群算法和遗传算法求解有......
挖掘数据流中最大频繁项集是从数据流中获得信息的一种有效手段,是数据流挖掘研究的热点之一。结合数据流的特点,提出了一种新的基......
基于相似性的数据挖掘模型,主要是用于发现分布式资源之间的相似性,利用相似性,融合分布式数据库,减小数据挖掘的规模.本文主要介......
大数据分析的理论核心就是数据挖掘,关联规则挖掘算法是数据挖掘的重要分支,其包含频繁项集的生成和关联规则的产生两个步骤,频繁......
将TCMA算法用于挖掘TCM-FP树中的最大频繁项集。在中药维度上应用了双支持度,既缩小了挖掘的范围又提高了规则的意义。算法挖掘的中......
分析最大频繁项集和完全频繁项集的关系,提出了一个挖掘最大频繁项集的高效算法DFMFI M iner(The M iner Basedon D epth-F irst S......
由于网络入侵检测系统的实时性要求,将传统的关联规则挖掘算法直接应用到入侵检测系统中,运行效率往往不能满足实际的需要。考虑到......
频繁项集挖掘是关联规则挖掘中最关键的步骤。最大频繁项集是一种常用的频繁项集简化表示方法。自顶向下的最大频繁项集挖掘方法在......
关联规则挖掘过程中,频繁项集的挖掘是最关键的步骤。最大频繁项集是最常用的频繁项集简化表示。基于FP-tree的最大频繁项集挖掘算......
对分布式数据库关联规则的挖掘与精简表示进行了研究,把频繁闭项集和最大频繁项集的概念推广到分布式数据库中,提出了在分布式环境......
针对Apriori类算法多次扫描数据库和FP-tree类算法需要构建大量条件模式树的问题,文中提出了挖掘最大频繁项集的GBMFI算法。采用垂......
由于其内在的计算复杂性,挖掘密集型数据集的全部频繁项集非常困难,解决方案之一是挖掘最大频繁项集。集合枚举树是最大频繁项集挖掘......
PITable-MAX是基于投影二维表的最大频繁模式挖掘算法。算法只需要遍历一次事务数据库,并将数据信息存入投影数据库中,在挖掘事务......
Order Table FPMax是基于有序FP-tree结构和二维表的最大频繁模式挖掘算法.有序FP-tree结构可以减少空间的浪费.基于树结构的有序......
DFP-growth-Max算法是一种基于DFP-tree方法和DFP-数组的最大频繁模式挖掘算法.DFP-tree是一种创建树结构的方法,它可以提高创建树......
为了提高数据挖掘算法在中医药数据处理中的效率,提出了采用TCMA算法挖掘TCM-FP树中的维间最大频繁项集。根据中医药数据的特点及......
结合基于图的关联规则挖掘和双向搜索的策略,产生最大频繁项集,从而提出基于图的最大频繁项集(graph based maximum frequen tset,G......
应用最大频繁项集信息熵来进行数据流变化检测.采用了一种新的数据流差异度度量方法;提出了一种新的有效挖掘最大频繁项集的算法;给出......
关联规则的研究是数据挖掘中的重要问题,如何高效地发现频繁项集是关联规则研究中的关键问题。根据数据库事务的统计性规律,在最大频......
随着信息技术的发展,数据挖掘技术得到了广泛的关注,这促使科学界人士对该项技术进行更为深入的研究。在数据挖掘技术中有众多研究......
摘要:关联规则挖掘是近年来数据挖掘领域中一个相当活跃的领域,频繁项集挖掘是关联规则挖掘中最重要的任务。最大频繁项集的规模远远......