论文部分内容阅读
数据挖掘,也称为数据库中的知识发现(Knowledge Discovery in Database,KDD),是从大量数据中提取出可信、新颖、有效并能被人理解的模式的高级处理过程,而关联规则是其6种模式中的一种。从购物篮分析到电信、银行业等海量数据的分析处理,关联规则已经在商业领域得到了广泛的实际应用,其中,寻找挖掘海量客户数据中的多维关联规则更是潜力无穷。 传统的Apriori算法是基于单维数据库,寻找布尔关联规则的常见算法,但其效率较低,使用范围有限的缺点同样明显,同时对于寻找多维关联规则并不适用。本文在原有Apriori算法的基础上,自主设计了一种计数器算法,通过对目标数据库对象的自主计数,有效地找到了一条寻找多维关联规则的方法,为多维数据库的关联规则挖掘提供了更多的技术支持。 计数器算法除了打破了原有Apriori算法不适用于寻找多维关联规则的缺陷之外,最大的优势在于在寻找多维关联规则的全过程中,只需要扫描一次目标数据库,这大大节省了对系统的负担,尤其是在对海量数据或远程数据库进行关联规则挖掘的时候,提高了整个算法的运行效率。 文章还通过自主编译的计算机程序,利用真实的电信企业用户数据,成功地寻找并输出了多维关联规则,实现了计数器算法的实际应用。