在大型数据集上提高序列挖掘效率的统计方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:gym510
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分析了在大型事务集合发现频繁模式的特点,给出了一个改进算法(称为AprioriAdjust算法),同时,发展了两项技术:(1)提出了事务集合的压缩过程.(2)展示了一种基于统计模式的方法来评价序列的支持度,在该方法中,考虑了整个过程中每一趟的支持度均值的收敛性,以进行有效的候选频繁集的剪枝.此外,还讨论了实验结果.比较AprioriTID算法,研究展示,AprioriAdjust算法在进行大型事务集合的挖掘时更有效,可扩展性更强.
其他文献
给出了一种基于进化算法产生系统负载来测试嵌入式操作系统性能的解决方案.该方法能较真实地模拟系统所遇到的实际情况,对嵌入式系统和嵌入式操作系统的测试具有一定的普遍意
经对Rijndael算法研究发现,其密文长度通常大于明文长度,且运算时间复杂度较高,不便于对IC卡的数据进行加密。按照IC卡数据加密的实际需求,提出了一种基于Rijndael算法的改进算法
血液:血液中的T淋巴细胞、B淋巴细胞和巨噬细胞具有抵御、抑制和杀灭癌细胞的作用。尤其是T淋巴细胞,它不但可以直接杀死癌细胞,同时在抗原的刺激下,能释放出七种与抗肿瘤有
针对仿真平台Vega在实现特定功能方面的不足,需要扩展自定义模块。基于对Vega体系结构和粒子系统不规则物体建模技术的深入研究,采用OpenGL三维图形库、Vega API和Open Perform
本文通过对天津地区有代表性的200多个不同种植年限菜园土壤耕层及典型剖面调查研究表明:老菜园土壤具有良好的主体构造,熟化层深厚,三相比协调、呈团粒结构,土壤微团聚体形状圆
在数据库加密系统中,秘密同态技术(privacy homomorphism)能够对一些敏感的、重要的数据直接在密文的状况下进行操作,从而有效地保护这些数据.该文从实际工作出发,阐明了秘密
采用田间长期定位试验,研究了不同施肥条件下浙江省三熟制高产稻田土壤有机碳的消长和平衡。结果表明,浙江省三熟制高平稻田耕层(0 ̄20cm)土壤有机碳(C)的年自然矿化量在1800 ̄2000kg/hm^2;作物根茬有机碳量与
近期,2013年陕西省职业院校“工业产品造型设计与快速成型”大赛在陕西工业职业技术学院圆满结束,来自省内7所职业院校的11支代表队参加了比赛,陕工职院的两支代表队囊括了前两
提出了无线通信网络(RCN)的2-终点可靠性问题.给出了最简路(SP)和最简路有序根树(SPRT)的概念,介绍了一个找出最简路有序根树和计算RCN2-终点可靠性的有效算法.
以不同的氮源(NH+4、NO-3、尿素)、不同的碳源(葡萄糖、蔗糖、糖蜜和淀粉) 及碳氮比(34∶1、20∶1、5∶1)为培养基研究不同C、N源和C/N 比对微生物溶磷的影响. 结果发现,曲霉