论文部分内容阅读
数据挖掘的一个基本任务是在海量数据的数据库中开采频繁项目集.本文提出了一种方法,不用开采频繁项目集全集,而是开采它的一个称为频繁无规则集集合的精简集.我们能用频繁无规则集集合还原出完整的频繁项目集集合和它们的精确支持度而不用读取数据库.可以看到,对频繁无规则集集合的开采是高效的.我们给出了一个算法HOPE-III来开采频繁无规则集集合,并将它和算法A-Close进行了比较.实验结果显示,HOPE-III在任何情况下都比A-Close的性能更好.