FP-树相关论文
从大型数据库中挖掘关联规则是数据挖掘领域中非常重要的研究课题。其中,最大频繁模式挖掘问题在关联规则挖掘任务中扮演着重要的角......
数据挖掘技术可以从数据仓库中的历史数据里提取出有价值的信息。关联规则数据挖掘是其中一个重要研究方向,挖掘的关键是选取恰当的......
随着数据库技术的飞速发展以及数据库管理系统的广泛应用,各个企业和部门通过自己的数据库管理系统,经过长年努力,已经积累了越来越多......
数据挖掘技术是当今的研究热点,已在诸如商务、医学与工程学等众多领域拥有广泛应用。它能够探查隐藏在数据间的有用信息,帮助分析决......
随着信息产业的发展,人们获取数据和知识的手段已趋向于多样化。人类拥有的数据量越来越庞大,在这些数据量的背后可能隐藏着大量我......
提出一种基于静态IS-树的频繁模式挖掘有效算法IS-mine,并与经典的Apriori算法和FP-growth算法进行了实验比较。算法直接构造频繁......
为了实现烟草病害准确预测和科学防治,提高烟草生产的质量,利用现代计算机技术、人工智能技术、数据库及数据挖掘技术实现了一个基......
随着数据库规模的增加或支持度阈值的减少,频繁模式的数量将以指数形式增长,FP-growth算法运行的时空效率将大为降低.本文提出一种......
缺陷关联使得目前的缺陷定位方法面临着严峻挑战,为了快速准确定位软件缺陷,保证软件产品质量,对定位方法的改进势在必行。基于函数调......
针对分布式环境下FP-tree的构造及合并,给出了一种网格环境下FP-tree的分布式构造算法GridDBMA。该算法中,各站点根据全局项目头表......
关联规则挖掘是数据挖掘领域的一个热点。Apriori算法作为进行关联规则挖掘的一种重要算法,其应用范围相当广泛。但用传统的Aprior......
文章针对快速挖掘模糊频繁项集问题,提出了一个基于fp-树的快速算法FFP,该算法提高了快速挖掘模糊频繁项集的时空效率.实验表明,该......
提出一种基于FP-树的时空关联规则挖掘算法,即STFP—tree(Spatio—temporalFP—tree)算法.算法对时空数据进行时间上的划分,并用空间谓......
关联规则的挖掘大都在用户设置的支持度阈值的限制条件下,产生频繁项目集合。得到关联规则。但是没有相关领域的专门知识,用户很难设......
传统的频繁模式挖掘算法往往会得到成百上千的结果模式,面对繁多的频繁模式用户通常要经过“二次挖掘”才能得到有用的目标模式。怎......
文章针对挖掘最大频繁项目集问题,提出了一个基于FP-树的快速算法DMFP,该算法引入了FP-树最大深度和非频繁2-项集,采用自顶向下和自底......
针对生物网络中频繁子图的挖掘问题,提出了一种基于EP-树结构的MaxFP算法。此算法以代谢路径作为研究对象,在适合于生物网络图简化模......
在语音识别系统中,Trigger模型作为语言模型的一种.用于描述长距离词与词之间的关系,然而以往的Trigger语言模型多是针对单个词的模型......
由于挖掘密集型数据的频繁模式完全集非常困难,因而改进了传统的FP-树结构并提出了一种基于改进FP-树的最大频繁模式挖掘算法IFP-M......
在由频繁项集产生关联规则时,利用提升度判断规则前、后件之间的正相关性可以避免产生一些无意义的关联。但是,这并不能保证规则前......
先从理论上证明分布数据库局部频繁集与全局候选频繁集之间存在某种关系, 利用该关系设计分布数据库关联规则挖掘算法. 该算法的局......
本文论述了关联规则的基本概念、分类、基于频繁项集思想的关联规则挖掘算法-Apriori算法,以及在基础上对Apriori算法的各种改进算......
为减少事务数据库的扫描次数和提高FP-growth算法的伸缩性,本文提出利用双链项头表改进FP-growth算法。......
论文首先对一种基于关联规则分类的算法做出了分析.然后对算法中的类关联规则的提取方法进行了改进,得到了一种新的基于关联规则分......
针对网络环境中大量短文本信息的鲜明特点,突破传统基于词标注的分类方法,提出了一种短文本频繁模式发现及其有效意义串分析算法。......
高维分类数据的处理一直是数据挖掘研究所面临的巨大挑战.传统聚类算法主要针对低维连续性数据的聚类。难以处理高维分类属性数据集......
分析了已有的垃圾E-mail过滤规则的算法的本质,给出了将邮件表示成事务的方法.在将垃圾邮件的训练集表示成事务集后,可以用FP-Tree......
介绍了关联规则挖掘算法的基本原理和基本概念,包括项目、项目集、置信度、支持度等。重点介绍了经典的Ariori算法、优化的FP_Grow......
针对基于FP-树挖掘最大频繁项集的算法需要大量的递归调用导致挖掘效率降低的问题,本文提出一种减枝策略并结合FP-树的结构,依据构......
期刊
目前,基于FP-树的最大频繁项集挖掘算法存在的一个问题是FP-树的规模过大,遍历树需耗费大量的运行时间,并且挖掘出来的很多频繁项......
近年来,随着网民数量的快速增长,各种网络服务的层出不穷,网络流量随之不断增大,网络行为也变得越来越复杂。恶意流量、恶意行为也......
该文提出了一种用FP-树挖掘大数据库的新方法及其算法PCM。在该方法中,首先把大数据库划分成子数据库的集合,然后在每个子数据库上构......
挖掘最大频繁项集是多种数据挖掘应用中的关键问题.在以往的最大频繁项集挖掘算法中,为了更新最大频繁候选项集集合,需要反复地扫描整......
FP-growth算法是目前已发表的最有效的频繁模式挖掘算法之一 .然而,由于在挖掘频繁模式时需要递归地生成大量的条件FP-树,其时空效......