快速挖掘相联规则算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:airfly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过研究发现,挖掘相联规则算法普遍的问题是潜在频繁项集规模过大,每趟扫描没有减少数据规模.该文提出了多段支持度算法.通过实验发现,当项数很多时所生成的候选项集不能完全放入内存,导致了算法性能的下降.针对这一问题,该文提出了一种新的思想来优化候选哈希树和内存空间.用候选项集的频繁程度来决定它们在哈希树中的分布,然后把候选哈希树中较频繁的项集放在内存,不频繁的项集放在外存,使得在扫描数据库计算支持度时,大部分操作都能在内存满足,极少需要访问外存.
其他文献
基于组件式地理信息系统的数据库管理工具(GISDB)是《军事辅助决策支持系统开发工具的研究》的一个子课题,该课题的研究内容主要有两个部分:设计并实现GISDB及使用组件技术实
任何能够提高系统性能的过程都可以被称作是学习的过程,学习问题一直被认为是人工智能和生物智能的核心问题。随着网络技术和数据存储技术的飞速发展,海量高维数据不断出现,如何
学位
后PC时代,嵌入式系统在计算机应用中日益发挥重要的作用,导致出现了许多的嵌入式操作系统.然而,这也迫使嵌入式应用的开发者要为一个应用移植不同的版本到不同的系统上.作为
随着网络技术的发展,尤其是Internet的蓬勃发展,网络系统的安全问题也显得越来越突出,例如网络中恶意的窃听行为,导致了许多用户帐号的泄密,各种保密数据的泄密等等.还有各种
在蓝牙发展过程中遇到的一个很重要的问题就是,不同厂家所生产的蓝牙设备之间的兼容性,也即互通性问题. 该文所要解抉的问题就是设计实现一个用于蓝牙协议一致性测试的系统.
办公自动化系统越来越受到人们重视,应用也越来越广泛,因此,针对办公自动化系统的安全问题的研究显得越来越重要。 本文介绍了目前办公自动化技术发展状况,对Lotus Notes/Domi
该文分析了目前具有代表性的视频会议系统所共同面临的可扩展性问题后,结合高速网带宽高、延迟小、支持组播的特点,设计和实现了一个适合高速网的可扩展规模的主从会议控制模
学位
随着网络规模和复杂性的增加,为了向网络用户提供既可靠又经济的信息传输服务,网络管理已成为现代网络发展中不可缺少的一部分。 ISO制定的CMIS/CMIP和IAB制定的SNMP是当前最