负关联规则增量更新技术的研究

来源 :山东轻工业学院 齐鲁工业大学 | 被引量 : 0次 | 上传用户:TeaTempTea
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,随着计算机技术和互联网技术的普及以及数据库技术的发展,各个应用领域的数据库中都积累了大量的数据,通过数据挖掘技术分析和理解这些数据,揭示其中隐藏的有用信息,已成为当前最为活跃的研究领域之一。其中关联规则挖掘是数据挖掘的一个重要模式,具有重要的理论价值和广泛的应用前景。关联规则就数据项之间的相关性来说,可以有正负关联规则之分。当前,正关联规则的挖掘受到了广泛的关注,而对于包含负属性或负项目的关联规则并未给予足够的重视。然而在很多应用领域中,事物的否定因素也是非常重要的信息来源,因此有必要研究事物负属性之间的关联关系。另一方面,随着时间的流逝,数据库中的数据也将会发生变化,这就是我们所说的增量更新问题。一般意义上的增量更新问题可以理解为:在数据库中增加或者减少数据后,在新的数据库中更新关联规则的问题。目前对于关联规则增量更新问题的研究主要是针对正关联规则的,例如Agrawal R和Srikant R提出的FUP更新算法;Brin S,Motwani R和Silverstein C提出的FUP2算法;国内的冯玉才、冯剑琳提出的IUA和PIUA算法等。对于负关联规则增量更新的研究相对较少。而广义上的增量更新可分为:数据库的变化和最小支持度、最小置信度的变化问题。负关联规则的增量更新与正关联规则的增量更新有所不同,具体表现在:①正关联规则仅存在于频繁项集中,而负关联规则不仅存在于频繁项集中,更多的是存在于非频繁项集中;②正关联规则仅有A=>B这一种形式,而负关联规则则有:┓A=>B、A=>┓B、┓A=>┓B三种形式;③在解决正关联规则增量更新问题时,只需求出更新后数据库中所有频繁项集,再利用公式求出正关联规则即可;而在解决负关联规则增量更新问题时,要求解出所有的频繁与非频繁项集,还要再利用算法挖掘正负关联规则。本文论述的内容主要分为以下几部分:数据挖掘技术,正负关联规则,经典关联规则挖掘算法的研究,正负关联规则的更新算法研究。本文的研究工作对进一步进行关联规则的研究以及关联规则的维护和更新等提供了一定的方法和理论依据。
其他文献
工作流技术是实现企业业务过程建模、业务过程仿真分析、业务过程优化、业务过程管理与集成,从而最终实现业务过程自动化的核心技术。早期的工作流应用系统都是集中式的,即由一
物流在现代社会中起着很重要的作用,为了实现高效物流管理,必须做到物流企业间信息流的快速畅通。各物流企业信息化建设程度和方式的差异,导致各信息系统间的数据交换产生诸
H.264是目前流行的视频压缩编码国际标准,基于H.264的运动估计研究一直是视频压缩中研究的热点。与以往的标准如MPEG-1/2/4及H.261/H.263相比,H.264的编码效率有了大幅度的提
近年来,本体在信息检索和语义网等领域中发挥着越来越重要的作用。但是手工构造本体却是一项繁琐的工作。如何从大量中文文献中自动或半自动地获得本体,成为本体在中文环境下
无线传感器网络是由低成本、低功耗、具备感知、数据处理、存储和无线通信能力的微型传感器节点通过自组织方式形成的网络。网络覆盖控制是无线传感器网络研究和应用的关键性
近年来,随着移动通讯技术的快速发展和手机用户人数的持续增长,手机短信因为具有随时收发、价格低廉和便于人们传达信息等优点,已经成为人们日常生活中进行信息交流的重要方
当前,企业信息化的进度正在不断地深入和发展,IT系统复杂度也随之逐渐提高。信息化建设不仅需要先进的IT系统及设备,更需要完善的配套服务来整合IT资源和企业业务,并为设备和系统
本文的研究工作主要是基于安徽省二○○八年科技攻关计划面上项目(08010204253):“嵌入式集成视觉辅助行车安全系统”和安徽省二○○八年度科技计划项目(08020203013):“基于
随着互连网的发展,P2P(peer-to-peer)已经成为发展最快的网络应用之一。有关调查表明,P2P业务己悄然占据了互联网业务总量的60%~80%,成为杀手级宽带互联网应用。P2P业务流量在
随着多媒体应用领域对三维建模速度和质量不断提高的要求,通过修改已有模型文件进行设计制作成为了提高效率、降低成本的重要途径。由于传统检索系统采用关键字进行检索,常常