基于数据仓库的关联规则挖掘研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zengbiao2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则发现是数据挖掘中的重要课题.挖掘关联规则问题就是产生支持度和可信度分别大于用户给定的最小支持度和最小可信度的关联规则.从用户与系统交互的角度来看,关联规则的发现可以分为传统的失联规则发现和可交互的关联规则发现.为了产生相对少而又有趣的关联规则,有必要采用可交互的关联规则发现.用户在可交互的关联规则发现中施加各种约束.约束分为个数约束、项目约束和函数约束三类.为了将约束很好地推进到算法中,需要分析约束的性质.约束具有反单调性、单调性、简洁性、可转变性和不可转变性.其中,单调、反单调和简洁的约束可以很好地推进到Apriori类算法中;可转变的约束只能在FP-growth类算法中实现;不可转变的约束现在还没有很好的解决办法.在个数约束、项目约束和函数约束中的支持度和可信度约束下,ISARS算法输出了满足约束的相对小的关联规则集R.在用户按可信度由高到低进行预测时,R和没有简化的符合约束的关联规则集是等效的.ISARS算法采用候选树作为存储结构,并运用约束的反单调性和简洁性、R的特性来提高算法性能.由于搜索范围的缩小和搜索层次的减少、没有生成所有的频繁项集而且对产生的频繁项集没有生成所有可能的规则,ISARS算法的性能得到了改进.该算法扫描数据库的次数取决于用户给出的个数约束.实验结果证明,ISARS算法比Apriori算法快大约7倍.
其他文献
利用开放式网络开展商务和政务活动对网络的安全性提出了更高的要求,最为重要的安全性要求包括:参与方的身份认证,会话的机密性,会话的完整性和抗抵赖性。常规的加密技术很难满足
随着Intranet/Internet的广泛应用,信息技术日益高速的发展,用户对数据存储性能的要求越来越高。而传统的分散式存储结构由于自身的局限性,很难从根本上解决实际面临的问题。
医学图像相对与其它类型的图像有其信息量大,处理涉及专业知识等特点,处理的难度很大.在分割算法方面,研究中改进了医学图像的二值化算法,给出了数种重要几何特征参量,综合地
GIS技术一直是计算机应用技术领域的热门研究之一,随着Internet技术的普及和深入,GIS也由传统的集中式向着C/S系统、WebGIS系统发展,WebGIS技术也成了GIS技术的前沿研究.WebG
随着数字电视的逐步普及,面向数字电视的智能化信息服务系统逐渐成为研究的热点。既提供个性化又提供大众化的服务是这种系统的目标,该系统涉及的许多相关领域值得深入研究。
该文基于Web服务的集成方案中,依靠Web服务,通过松散的应用集成,企业能够实时地访问不同部门、不同应用、不同平台和不同系统的信息.Web服务系列技术是架构在XML技术的基础上
车辆导航定位系统是智能交通的最基本的单元,而监控及指挥系统是管理者进行管理的基本工具.该论文首先介绍了车辆导航系统的基本构成及相关联的地理信息系统(简称GIS)的基本
多媒体数据库技术是一门新的数据库技术。按内容检索是目前多媒体数据库系统迫切需要的查询手段,也是急待研究的课题。本文围绕基于内容检索的多媒体数据库系统中的关键问题进