论文部分内容阅读
本文在FP树挖掘算法的基础上,提出了无用户设置最小支持度阈值的关联规则挖掘算法。该算法通过兴趣度的设置动态地得到不同项集的不同支持度,并支持用户与算法的交互功能,用户能通过兴趣度的设置来控制产生的频繁项目集合中元素的数目,而且不需要用户有与之相关的专业领域知识就可以完成关联规则的挖掘。实验结果表明该算法在性能上与FP-树算法相比不占优势,原因是该算法的理论框架与FP树算法相似,而且其时间复杂度大于FP树算法的时间复杂度,但它为关联规则挖掘的研究提供了一个新的方向。
另外提出了基于项目限制的双FP树的关联规则挖掘算法,该算法对类型和作用相同的项分箱,根据用户的兴趣划分限制集合,用两棵FP-树分别存储事务数据库和限制数据库,对所有与对应限制项目集合匹配的项目集合依次确定是否是频繁的。该算法弥补了无用户设置最小支持度阈值的关联规则挖掘算法使用了统一兴趣度的缺点,能产生兴趣度小而用户又感兴趣的频繁项。