一种基于约简模式的频繁项目集挖掘算法

来源 :第二十一届中国数据库学术会议 | 被引量 : 0次 | 上传用户:mnm159753
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
发现频繁项目集是关联规则挖掘应用中的关键技术和步骤,目前已经提出的可用于发现频繁项目集的算法主要有两大类,一类是Apriori及其改进算法,另一类是基于FP-tree的诸多算法。本文分析了此两类算法的技术难点,提出了一种基于二进制位的数据库约简模式以及基于此约简模式的频繁项目集挖掘算法FIMA,并举例说明了算法FIMA的执行过程,实例和实验结果表明算法FIMA具有较好的性能。另外,本文的设计思想可以方便地应用到频繁项目集的增量式更新算法中去。
其他文献
使用基于知识的方法解决语义问题是目前研究较多的方向,其出发点是希望利用经验和领域分析的结果建立一套统一的知识背景,从而统一领域内用户对信息的理解.本文提出的设计模式就尝试将本体概念和传统数据库设计方法结合起来,在关系数据库设计阶段就引入语义信息的设计模式,使得智能代理能够从语义的角度理解传统的关系数据库。本文以学校的电子教务系统为背景,介绍基于本体的关系数据库的语义设计模型。其特点是通过对领域内知
Web Services是一种在Internet上动态共享应用数据和功能的手段,为构建高效、灵活的新型软件应用提供契机。CORBA在企业级应用集成取得极大成功的同时,延伸到Internet有一定的局限性.本文提出CORBA Web Service,静态、动态两种体系结构,重点研究可扩展体系结构、SOAP/IIOP协议数据类型映射、统一服务提供框架和服务动态发布等多项关键技术,将面向企业的相对封闭、
本文就分布式数据库系统中基于并行分层式链路的P2L2PC协议进行了研究。研究表明,P2L2PC协议是在2PC协议基础之上的扩充,P2LZPC协议中发生的消息交换可能是并行的,而且对并行消息的反应也进行推断,既保证并行消息的补偿性又使并行消息不产生逻辑上的冲突,这也是P2L2PC协议和传统2PC协议的区别,也是P2L2PC协议本身的优点所在。P2L2PC协议有其特定的优点,尤其是P2L2PC协议的较
本文介绍了一个对来自多数据源的汉语短文进行话题识别的系统及其实现方法。从初步的模拟实验结果来看.该系统达到了预期的目标,系统中使用的词频统计方法和短文聚类方法是有效的。对系统的完善和进行实际环境中的完整测试还需要做大量的工作。短文的聚类问题仍是今后需要研究的重点。
本文提出了基于嵌入式数据库实现语义缓存的技术方案(SCEDB, Semantic Cache Based on Em-bedded Database),由于采用嵌入式数据库,在客户端缓存的查询与结果可与服务器的数据库管理系统在数据存储和运算上实现统一,也便于实现客户端的查询/修剪,替代策略。SCEDB的设计采用独立部件化设计方法,能最大限度节省客户端开销。
本文为了避免不必要的关闭结点的磁盘访问,提出了一个可以减少磁盘访问次数的快速Dwarf计算算法QDwarf,该算法能实现一个关闭结点写入磁盘后,不需再读出,实验表明,新的算法在计算性能上有明显的提高。
信息系统常采用知识导航模块,该模块的核心是框架本体库,因为框架表示能够通过对象的联系属性在不同概念之间建立联系,其数据结构适合知识导航.当前,本体主要有逻辑表示和框架结构表示.框架表示法的优点是直观,其数据结构适合知识导航.逻辑表示法能表达复杂的问题,语义清晰,具有自动推理功能,但是不能直接用于知识导航.要使现有的描述逻辑本体库能够为知识导航服务就必须转化为框架本体库,建立框架本体库中概念之间的关
关联规则挖掘是从大量数据的项目集之间的关联或者相关联系中来发现频繁项目集的主要技术和方法.本文引入模糊集理论和有效支持度的概念,并充分考虑有效支持度的阈值和有效支持度的支持频度,提出了一种新的产生频繁模糊项集算法的修改方案,由于有效支持度的引入直接作用于产生频繁模糊项集的最初端,在算法的执行效率上具有非常明显的效果,
自1989年12位著名学者在底特律集会发出了"从数据库发现知识(KDD)"的号召以来,KDD的研究与应用已在各个领域都取得了丰硕的成果.本文目的是进一步推广函数依赖,使之进而应用到分类规则挖掘.众所周知目前的所有的分类规则的算法都不能一次性求出全部分类规则.本文将借助对函数依赖的推广给出一个一次性求出全部分类规则的方法,克服了以上这些方法的全部缺点.为知识发现提供了新思路.
空间聚类方法主要有划分方法和层次方法。然而,它们都经常以局部最优结束聚类过程,在实现过程中没有考虑保持群体的全局分布特性,这个缺陷大大限制了其应用范围。遗传算法(Genetic Algorithm,简称GA)模仿生物进化过程的自然选择和进化机制,是一种基于群体的全局随机优化算法。因此,可以考虑运用遗传算法来解决空间聚类问题。在这一思想指导下,本文提出了一种将遗传算法和K-均值(K-means )聚