基于概念格的关联规则挖掘方法的研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:learner1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是一种高级的数据分析工具,通过分析所观察的数据集以发现可信的数据间的未知关系,并提供给数据拥有者可理解的、新颖的和有用的归纳数据。关联规则挖掘用于寻找给定数据集中数据项之间的有趣关联或相关关系。关联规则揭示了数据项间的未知的依赖关系,根据所挖掘的关联关系,可以从一个数据对象的信息来推断另一个数据对象的信息。概念格的每个结点本质上是一个最大项目集,非常有利于关联规则的提取。因此,概念格作为形式概念分析理论中的核心结构,已经在软件工程和知识发现等领域得到了广泛的应用。在利用概念格进行关联规则挖掘时,概念格的快速构造具有重要的意义,而在目前已有的概念格的构造算法中,增量式的构造方式具有明显的优势。本文通过对关联规则挖掘方法和概念格的增量式构造过程的分析,识别出要解决的问题,并针对挖掘关联规则的关键步骤在于提取频繁项目集这一重点,提出了采用广义表结构对概念格结点进行组织,研究了这种基于广义表结构的动态构造概念格的算法,并将之应用于关联规则的挖掘。由于本算法采取的广义表结构存储概念结点,将各结点依照外延数分层次的组织,在提取频繁结点时,无需比对所有结点的支持数,就可将满足最小支持度的结点取出,大大减少了遍历概念结点的数目,从而有效的减少了算法执行的时间。文章给出了算法的伪代码描述,并对该算法的时间性能进行了分析和验证,结果表明,该算法在时间性能上优于Apriori算法和Godin算法。
其他文献
随着计算机技术和网络技术的飞速发展,网络安全问题越来越突出,不断提出新的挑战。传统的防御策略以及攻击手段与方法日趋复杂化和多样化。入侵检测逐渐成为信息安全领域的一个
随着国内石油工业的较快发展,计算机网络化的管理模式得到了普遍推广,作为勘探和开发油气田的重要环节,石油钻井信息化技术的发展从面向事务处理阶段逐渐转向面向分析决策阶段。
随着网络技术和互联网的迅速发展,网络应用的普及化程度越来越高,网络上传输的数据量激增。为了充分发挥网络资源的作用,科学合理管理网络的重要性日益凸显。利用网络监控实现网
随着软件工程的发展,基于组件的开发已经成为目前软件开发的主流模式。组件的可靠性和安全性直接影响整个系统的稳定性。组件的封装特性使得基于组件的测试具有较大的难度。
随着集群技术的发展,结点和链路的失效不可避免。因此,在有结点和链路失效下对通信终端间存在可靠通信路径的概率和所有正常结点的互通率进行研究就非常有必要了。由于网络中结
组合优化是运筹学的重要分支,主要通过对数学方法的研究寻找离散事件的最优编排、分组、次序或筛选等。大多数这类问题属于NP完全问题。当问题规模逐渐扩大时,其解空间呈组合爆
随着计算机网络的快速发展,网络协议测试技术成为人们日益关注的焦点,而如何才能设计出可靠的网络协议测试工具已经成为人们必须要面对的问题。为此,协议工程(Protocl Engine
互联网的快速发展使得 IP地址资源日渐枯竭。将IPv4地址空间升级为IPv6地址空间可以从根本上扩充地址空间,但还需要大量的升级换代工作;而另一途径是使用NAT(Network Address Tr
随着经济的发展,项目管理变得越来越重要。项目调度作为项目管理的重要组成部分,具有网络结构特点,各个项目成员分布在网络的节点上,负责整个项目的一项或几项工作,拥有各自的资源
协同过滤推荐算法作为推荐系统领域最成功的算法之一,为解决互联网时代信息过载问题发挥了重要作用。协同过滤推荐算法依据用户对项目的历史评分记录等偏好信息,通过计算用户