数值型多维关联规则挖掘研究

来源 :西南师范大学 西南大学 | 被引量 : 6次 | 上传用户:jerryymy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,数据挖掘引起了信息产业界的极大关注。其主要原因是存在大量数据。可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。 关联规则是数据挖掘研究中的一个重要课题。它是从数据集中提取出有趣频繁模式的过程。现在,已经提出很多经典的关联规则挖掘算法,如Apriori算法。这些经典的算法绝大多数适用于布尔型数据。由于数据库中的数据类型是多样的,因此如何在布尔型之外的其他类型上进行关联规则挖掘是当前关联规则研究中的热点。 常见的数据类型有布尔型、类别型、数值型。其中数值型关联规则挖掘是当前关注较多的领域。对于数值型数据,首要的是将其在值域上划分为区间。本文将聚类思想引入到关联规则挖掘中。提出了区间阈值的概念,在该阈值的指导下对属性进行划分,以解决现有算法不能解决的问题。 本文首先对数据挖掘进行介绍。然后将主要经典关联规则挖掘算法逐一介绍。这些算法是多维关联规则挖掘算法的基础。论文重点对数值型多维关联规则进行研究。分别介绍了区间合并算法和聚类算法。在聚类算法中,论文提出了CARB算法。该算法是一个单趟扫描算法。当用户指定区间距离阈值interval后,算法自动将属性划分为区间。 本文的研究对于数值型多维关联规则和数据预处理的使用有积极意义。
其他文献
当前科学技术正进入多学科相互交叉、相互渗透、相互影响的时代,生命科学与工程科学的交叉、渗透和相互促进是其中一个典型例子,也是近代科学技术发展的一个显著特点。进化算
在当今以数据为中心的时代,越来越多的应用需要访问各种异构数据源,特别是对于企业应用来说,这既是企业内部发展的需要,也是企业适应外部环境的需要。XML因其具有自描述性、
实时协同编辑系统是一类重要的CSCW 应用系统,具有实时性、分布性和无约束性三个特点。一致性维护是设计和实现此类系统最具挑战性的一个世界级难题。传统的令牌、加锁、串行
随着微电子技术和移动通讯技术的发展,嵌入式设备和移动终端具有越来越强大的处理能力。这引发了人们要把嵌入式移动终端作为下一代个人工作平台和轻便的移动办公载体的遐想
和传统本地存储相比,云存储因为价格低廉,和管理方便,吸引了越来越多的企业和个人用户倾向将数据外包存储到第三方云中。但是目前云中数据的安全和隐私问题成为阻碍云服务进一步
随着因特网和电子商务的快速发展,引发了企业应用程序可用信息数量和类型的急剧增长,信息集成已经成为当前企业面临的巨大挑战。本文在企业信息集成发展现状研究基础上,将模
随着办公自动化的快速发展,越来越多的人喜欢用电子邮件进行交流。由于人们每天需要处理越来越多的邮件,所以迫切需要对邮件进行分类处理。与此同时,随着机器学习和数据挖掘
  本文对LINUX系统安全这方面做的研究。LINUX作为一个现代的操作系统,正在各个方面得到广泛的应用。LINUX在服务器、嵌入式等方面已经取得不俗的成绩,在桌面系统方面,也逐渐
机群系统的规模增大,部件增多,导致了机群的组合错误率也不断上升。节点失效使运行于机群节点上的作业面临中途失败,从而造成巨大的资源浪费,甚至导致大的作业无法完成。检查
随着知识经济的到来,人们对知识的需求显得越来越重要,由曹存根研究员主持的国家知识基础设施建设(NKI)集成了各学科的知识库,旨在实现“在恰当的时间,以恰当的语言、恰当的