【摘 要】
:
频繁项集挖掘是关联规则挖掘中的关键任务,非常耗费时间.为提高频繁项集的产生效率,提出一种基于倒排索引位运算的深度优先频繁项集挖掘算法(DF-FIMBIIⅡ).该算法以二进制数
论文部分内容阅读
频繁项集挖掘是关联规则挖掘中的关键任务,非常耗费时间.为提高频繁项集的产生效率,提出一种基于倒排索引位运算的深度优先频繁项集挖掘算法(DF-FIMBIIⅡ).该算法以二进制数组存储项目到事务的倒排索引,通过位运算计算两个项目的支持计数,并采用深度优先搜索策略递归地挖掘不同的k-频繁项集.在chess、mushroom、pumb_star、T40I10D100K等数据集上,对DF-FIMBⅡ、Apriori、ECLAT、BitTableFI、Index-BitTableFI等算法进行了实验比较.实验结果表明,在数据规模不是非常巨大和支持度较小的情况下,无论数据集的稠密程度如何,DF-FIMBⅡ均具有较好的时间优越性.
其他文献
自2009年10月30日我国创业板市场推出以来,创业板上市公司数量不断增加、所涉区域不断扩大、所涉猎行业逐步多元化,本文对首次上市的28家创业板上市公司进行成长性判定,并从
南堡凹陷区域构造上位于渤海湾盆地黄骅坳陷北部,是一个新生代开始发育的含油气凹陷,经历了断陷期和坳陷期两个演化阶段.回剥分析表明,盆地充填具有"幕式"沉降特征.文中通过
概述了石炭-二叠系界线在世界、中国和新疆地区的演变,按国际委员会批准的牙形石Streptoynathodus isolatus的首现位置作为二叠系底界的标准,重新标定了塔里木盆地周缘柯坪地
假设利率服从扩展的Vasicek模型,标的资产价格服从分数跳-扩散过程,利用无套利理论与多元正态分布,导出了规定时间的重置期权的定价公式.
为给江苏省“十二五”期间调整水利投资结构、统筹安排水利投资项目提供思路,对江苏省“十一五”期间水利投资数据进行了归类统计,并与“九五”、“十五”期间情况进行了对比
MAK-Ⅱ和CГДT-HB器是从俄罗斯引进的测井仪器.MAK-Ⅱ仪器又称声波水泥胶结测井仪器,它用于评价套管井水泥胶结质量;CГДT-HB仪器又称伽马密度-套管壁厚度测井仪,它是一种
阐述了先张法预应力空心板是公路桥梁施工常见的施工方法,根据实际经验,就场地平整、张拉台制作、底模制作、预应力筋张拉、空心板混凝土浇筑、空心板的移位与安装等施工要点
针对网络化制造模式下协同产品配置设计的信息需求,探讨了一种基于语义网的协同产品配置模型.在该模型中提出了一种基于语义网的协同产品配置模型的体系结构,构建了基于语义
介绍了钢轨接头病害的种类,阐述了接头病害发生的原理,并针对各种钢轨接头病害提出了具体的整治方法,最后介绍了钢轨接头日常维修养护过程中应注意的问题,以保证钢轨接头处的