分布式系统下关联规则挖掘的研究与实现

来源 :大连交通大学 | 被引量 : 0次 | 上传用户:li13688
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自从1993年关联规则的概念由Agrawal等人提出之后,关联规则挖掘的研究就一直是数据挖掘领域的一个非常活跃的研究领域。目前,在集中式环境下的关联规则挖掘的研究已经取得了丰硕的成果,相关的理论也已趋于成熟和完善。但是在分布式系统环境下进行关联规则挖掘的研究是最近几年来刚刚提出的一个新的课题,相应的研究成果不多,相关的理论也较少。随着网络技术和分布式数据库技术的发展,大量的数据分布存储在网络的各个节点。由于受到通信效率,安全性等因素的影响,这些分布的数据不可能集中起来存储,从而使基于分布式系统的关联规则挖掘算法的研究成为亟待解决的问题。这也正是本课题研究的意义所在。 本文在对关联规则的基本原理和方法进行介绍和分析的基础之上,得到了一种Apriori算法的改进算法—AprTidRec算法。在对关联规则分布式挖掘算法CD算法,DD算法和FDM算法的介绍和分析基础之上,得到了在分布式系统下实现关联规则挖掘的两种方案,给出了两种方案的体系结构图,并对两者进行了对比分析。本文的最后给出了分布式关联规则挖掘的系统实现方案,该系统基于C/S结构,主要由关联规则的局部挖掘模块和全局挖掘模块两个基本模块组成。运行关联规则局部挖掘模块之后,将基于局部数据库挖掘出局部关联规则,运行服务器端的关联规则挖掘模块,将完成关联规则的全局挖掘,得到基于全局数据库的全局频繁项目集。 为了验证算法的有效性,采用设计实验的方法对关联规则挖掘系统进行了测试,实验结果表明该算法具有很好的适用性和较高的执行效率。
其他文献
随着经济全球化的发展,国际间的产品流通和信息交流越来越普遍,对产品提供唯一、可靠的评判标准成为产品可以走向国际市场的必需条件。STEP(Standard for the Exchange of Product data)是产品数据的表达与交换的简称,它可以完整表达产品的数据信息;GPS(Dimensional and Geometrical Product Specification and Ve
现场总线的产生和发展引发了工业控制领域的一场革命。现场总线以其全数字、全分散、全开放的特点成为控制领域的一个热点,基于现场总线的控制系统正在逐步取代传统控制系统,代
Spinescence has been thought to have evolved mainly as a defense against herbivores. Thus, studying its evolution in a whole flora is an excellent approach for
随着电子控制技术的发展,自动变速器在性能方面得到不断的完善,价格持续降低,所以双离合器自动变速器在汽车上的应用日益广泛,而DCT以其优越的传动效率、平顺的换档品质和良好的
作为一种语用现象,语用预设与语篇信息流之间有着密不可分的关系,在英语阅读理解中有着不可低估的重要作用.本文试图通过语用预设在话语、篇章组织中的作用来阐述其对英语阅
期刊
聚合物改性沥青得到了越来越广泛的应用,对聚合物改性沥青的研究也越来越深入,但对聚合物改性沥青的研究还存在着不足:首先国内目前还没有一家单位能够生产出存储式改性沥青(或
学位
我国改革开放取得了伟大成就,人们对生活质量的要求不断提高,对于幸福的追求已经逐渐成为一种社会运动,国家高度重视保障满足人们幸福追求的制度建构。幸福将成为全面实现小康社
沥青路面具有抗滑、耐磨、表面平整、密实耐久、抗疲劳、抗车辙、行车舒适、抗低温开裂、施工周期短等优点,得到了越来越多的应用。目前沥青路面已被许多国家的高速公路所采用
长江水道一直以来就是我国的黄金水道,其沿岸地区的经济发展与之关系都密不可分。长江的上游经济带始于宜昌(并延伸到荆州市),沿长江上溯至成渝平原,以河流主干道为轴心,向两岸辐射