一种不产生候选项挖掘频繁项集的新算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:dexter001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Apriori算法是关联规则挖掘算法中应用最为广泛的一种算法,它的主要目的是从大量的事务数据中通过候选项集挖掘出有趣的频繁项集,从而为用户提供有意义的关联关系。但随着数据库规模的扩大,apriori算法可能会产生如下两大棘手问题:大量候选项集的产生将造成巨大计算量的浪费;为剪掉无用候选项如何设置阈值。这些问题相对于众多普通用户来说都具有挑战性。该文提出的代码与运算是一种无须候选项挖掘频繁项集的算法,用户无须为设置阈值而煞费苦心。同时事务压缩算法的加入大大减少了算法中的计算量。
其他文献
在有机化合物,尤其是天然产物中,碳碳双键的构型往往对其生理活性起了决定性的作用。本文综述了在有机合成领域中,通过炔烃立体选择性还原制备Z—或E—烯烃的近期方法。
深圳福田红树林保护区是广东省内伶仃福田国家级自然保护区的一部分,面积为304万亩。本文论述了该区的陆生植被类型及其特点,并根据群落的组成成份、外貌结构及种群特征,将该
查找路由表以给出下一跳地址是路由器中分组转发的核心步骤,因此快速的路由查表算法是实现高速分组转发的关键。该文分析了IPv4下路由查表问题及其难点,详细介绍了现有的各种查
文章首先分析了数据仓库与数据库技术本质的区别,讨论了软件系统开发的生命周期方法、快速原型法、螺旋法的特点,然后结合数据仓库开发特点,提出了基于数据驱动的螺旋式开发方法
细粒度扩展编码(FGS:Fine-Gmnularity-Scalability)由于具有很强的灵活性和较好的视频流化性能已经被MPEG-4和H.26L等标准所采用。论文在相关研究的基础上,采用了基于滑动窗口的
本文介绍了一种介质损耗角正切定义的新型绝缘介质损耗测试仪,对其系统结构、数据处理方法、测量过程和抗干扰措施等进行了重点介绍。
在远程镜像系统中,通信链路的可用带宽和主站应用程序的I/O数据率都可能会不断变化,因此通信链路的负载也会随之改变。但现今一些基于存储设备块级别的远程镜像系统(如EMCSRDF,IBMPPRC,XRC等)在异步模式下并未涉及这些变化因素。该文综合考虑了这一点,简要地设计了一个异步远程镜像方案——自适应异步模式,它不但避免了rollingdisaster的产生,而且能够根据链路负载的变化动态地调整在链
论述了理工科院校开设科技英语课的必要性,以及通过学习专业英语,培养学生撰写科技论文英语摘要的能力。
分析了现在电厂热工人员在现场使用的设备、手段及存在的不足之处 ;介绍了最新产品“热控系统现场状态检测及专家系统”中的SPE - 97A系统。
毕业设计是学生学习过程的一个重要环节,本文就毕业设计的选题、指导等提出了自己的一些看法。