论文部分内容阅读
近几年来,随着计算机技术和互联网技术的普及以及数据库技术的发展,各个应用领域的数据库中都积累了大量的数据,通过数据挖掘技术分析和理解这些数据,揭示其中隐藏的有用信息,已成为当前最为活跃的研究领域之一。其中关联规则挖掘是数据挖掘的一个重要模式,具有重要的理论价值和广泛的应用前景。关联规则就数据项之间的相关性来说,可以有正负关联规则之分。当前,正关联规则的挖掘受到了广泛的关注,而对于包含负属性或负项目的关联规则并未给予足够的重视。然而在很多应用领域中,事物的否定因素也是非常重要的信息来源,因此有必要研究事物负属性之间的关联关系。另一方面,随着时间的流逝,数据库中的数据也将会发生变化,这就是我们所说的增量更新问题。一般意义上的增量更新问题可以理解为:在数据库中增加或者减少数据后,在新的数据库中更新关联规则的问题。目前对于关联规则增量更新问题的研究主要是针对正关联规则的,例如Agrawal R和Srikant R提出的FUP更新算法;Brin S,Motwani R和Silverstein C提出的FUP2算法;国内的冯玉才、冯剑琳提出的IUA和PIUA算法等。对于负关联规则增量更新的研究相对较少。而广义上的增量更新可分为:数据库的变化和最小支持度、最小置信度的变化问题。负关联规则的增量更新与正关联规则的增量更新有所不同,具体表现在:①正关联规则仅存在于频繁项集中,而负关联规则不仅存在于频繁项集中,更多的是存在于非频繁项集中;②正关联规则仅有A=>B这一种形式,而负关联规则则有:┓A=>B、A=>┓B、┓A=>┓B三种形式;③在解决正关联规则增量更新问题时,只需求出更新后数据库中所有频繁项集,再利用公式求出正关联规则即可;而在解决负关联规则增量更新问题时,要求解出所有的频繁与非频繁项集,还要再利用算法挖掘正负关联规则。本文论述的内容主要分为以下几部分:数据挖掘技术,正负关联规则,经典关联规则挖掘算法的研究,正负关联规则的更新算法研究。本文的研究工作对进一步进行关联规则的研究以及关联规则的维护和更新等提供了一定的方法和理论依据。