一种改进的频繁闭项集挖掘算法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:zpbaqq1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
频繁闭项集惟一确定频繁项集且规模小得多,但挖掘频繁闭项集仍是很费时的.为提高挖掘效率,提出了一种改进的频繁闭项集挖掘算法DCI-Closed-Index.该算法用"索引数组"来组织数据,通过为每个项目增加包含索引,找到频繁共同出现的项集.利用二进制位图技术,给出了一个求包含索引的快速算法.然后根据项目在包含索引中出现的频率由高到低进行排序,并利用包含索引作为启发信息,合并同时出现且支持度相等的频繁项,得到初始生成子,从而大大缩小了搜索空间.同时利用索引数组对每一个生成子的前序集和后序集进行约简,得到新的、较小的约简前序集和约简后序集.并证明了约简前序集和后序集与原来的前序集和后序集的功能是一样的.从而减少了候选生成子的集合包含判断的操作.实验结果表明,该算法的性能优于其他主流算法.
其他文献
<正>本文以北京某实际工程为例,分析计算了地源热泵供暖和常规燃气锅炉供暖两种方案的运行费用。首先运用DeST软件对建筑物进行了全年的动态负荷模拟,北京地区的气候特点是年
对延迟焦化装置生产的焦化汽油中所携带"焦粉"的成分及其原因进行了分析。通过热重分析及X射线粉末衍射方法对"焦粉"进行定性分析,经理论计算与实际结果进行对比发现"焦粉"的
初中数学自主学习型课堂,在教学方式上,强调尊重学生、相信学生,突出培养学生的自主、合作、探究学习学习方式。自主学习是核心,合作、探究学习是辅助和补充。教学过程中,要
医疗技术临床应用管理是保障医疗安全、规范医疗行为的一种行政管理手段。欧美等国以医疗技术评估作为主要手段,我国自20世纪90年代起初步建立医疗技术准人制度。本文通过对
结合设计实践 ,对可燃液体立式储罐区消防冷却的水量计算及计算中应注意的问题加以论述 ,同时对在设计中应注意的问题提出了探讨性意见
收入准则是每一个财务人员工作中都必须掌握的一个准则。2017年7月,财政部发布了最新修订的《企业会计准则第14号——收入》并决定在2018年正式启用。其中的文件规定对境内外
<正> 一、前言苹果酸,又名羟基丁二酸,是一种重要的有机酸。有D型和L型两种光学异构体。目前国内用化学合成法生产的苹果酸只能得到DL型,在食品和医药上它仅有一半能利用。应
Dijkstra算法在求解两指定顶点间最短距离时 ,对两顶点之间最短路径以外的大量顶点进行了计算 ,而影响了算法的速度 .在对 Dijkstra算法分析的基础上 ,结合网络模型的特点 ,
<正> 本文的讨论均在Lebesgue测度空间(R′,L,m)中进行。通常,测度有限集E(mE<+∞)上无界可测函数f(x)的L—积分是用f(x)之正部f+(x)、负部f-(x)的"截尾函数"[f+(x)]N、[f-(x)]N按下式定义的:
本文对中药当归的炮制历史沿革、炮制的传统理论作了系统的探讨。当归见诸历代文献的炮制方法达20种之多,其中常用的有酒炮制、炒制、制炭等。当归炮制的理论主要是在改变药