论文部分内容阅读
随着数据库技术的发展,我们已经积累了海量的数据。这些数据中蕴涵了大量有价值的知识、模式、规律等,人们为了获得这些信息用以指导自己的生产、生活而应运产生了数据挖掘技术。数据挖掘又称为数据库中的知识发现,在最近几年被数据库界广泛研究,并且已经在商业、金融、医疗等领域得到成功地应用。因此,数据挖掘技术的研究就有着重要的意义。 关联规则是数据挖掘的一个重要挖掘方法。自从 Agrawal 等学者于 1993 年首先提出了挖掘顾客交易数据库中项集的关联规则问题以来,诸多的研究学者对关联规则进行了大量的研究并取得了丰硕的成果。由于关联规则挖掘一般面向的是大型事务数据库,关联规则的提取需要重复扫描数据库,因而当前在关联规则挖掘领域的研究热点集中在如何提高挖掘算法的高效性上。本文就针对这个问题提出了一种从大型数据库中挖掘关联规则的快速算法。由于当使用关联规则进行数据挖掘时,使用者为了达到一定的挖掘效果,经常需要不断地改变关联规则的支持度阈值,因此该算法以经典的 Apriori 算法为基础,可以在提出新的支持度阈值后直接在首次挖掘的基础上进行再一次挖掘。同时,我们还利用部分数据库记录进行实验验证,实验结果表明它较之经典的 Apriori 算法的实现速度有明显提高。