多维关联规则挖掘算法研究

来源 :天津理工大学 | 被引量 : 7次 | 上传用户:tenderboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的迅速发展及其广泛应用,在数据库中积累的数据量越来越多。激增的数据背后隐藏着许多重要的信息,人们希望能够在已有的大量数据的基础上进行科学研究、商业决策或企业管理等更高层次的分析,从中提取有价值的信息,从而为管理和决策提供依据。数据挖掘就是从大量的、不完全的、有噪声的、模糊的数据中,提取隐含的、人们事先不知道的、但又是潜在有用的信息和知识的过程。本毕业设计的主要目标是研究发现多维数据间的关联性的有效方法。基于数据仓库和OLAP的多维数据分析法是以统计分析的方法对多维数据进行分析,而多维关联挖掘算法是用知识发现的方法分析多维数据之间的关联性。本论文从这两方面进行了研究。本文首先对基于数据仓库和OLAP的多维数据分析法进行了研究,主要有数据仓库的建模方法,利用OLAP对数据仓库中的多维数据进行分析的方法。并在此研究的基础上进行了高校毕业生就业状况分析数据仓库模型的设计,并利用OLAP提供的切片、切块、上卷和下钻等方法对高校毕业生就业状况进行了分析。其次,本文在对关联挖掘方法及其发展状况进行了研究的基础上,提出了一个基于SQL查询的多维关联规则挖掘算法,该算法利用SQL新标准中的CUBE运算符,并结合了SQL强大的查询功能,能够对一定数据量的多维数据集进行高效的多维关联挖掘。为实现对更大数据集的有效挖掘,采取分块挖掘的方式对算法进行了改进,本文对算法及其设计思想进行了详细的论述,并给出了对算法的一些测试结果。分析和实验表明,算法简单,易于实现,无需多遍扫描挖掘数据集,挖掘效率高。最后,为便于用户利用本算法进行多维关联挖掘,还将SQL Server数据库的强大数据处理功能和C#的面向对象的功能相结合,设计开发了可视化多维关联挖掘工具。
其他文献
大规模、跨领域数据仓库的出现,使数据仓库中的数据量日益增多,数据模式日趋复杂,清洗过程设计更加繁琐。这些变化使数据清洗软件的开发出现了很多新的需求,如动态构建、频繁的修
条码技术是以计算机技术、光电传感技术和通信技术为基础而发展起来的一项自动识别技术。现在已经成为信息数据自动输入、识别的重要方法和手段。现代高新技术的发展,迫切要求
“报文”是互联网用IP协议进行传输的基本单位,也是被动测量“感知”网络的基本单位,因此被动测量所获得的原始信息是报文流,通常称为“IPTRACE”。早期相关的研究工作直接面向T
我国高校的信息化过程一般经历两个阶段,第一阶段:各业务部门独立地开发应用系统,这些应用系统在一定程度上提高了校园信息化程度。但是这些系统由于技术平台、开发环境的差异,彼
随着医学影像诊断技术的发展,大量的医学图像数据随之产生。通常意义上的胸部影像学的主要研究对象就是肺部,它一般通过建立肺窗来观察相应肺部影像,而计算机断层图像(CT)则
工作流管理技术是实现企业业务过程重组、过程管理与过程自动化的核心技术。作为工作流技术的软件载体,工作流管理系统WfMS(Workflow ManagementSystem)的主要目标是通过调用有关信息资源与人力资源来协调业务流程中的各个环节,使之按照一定的顺序执行,从而达到业务过程自动化的目的。目前的工作流管理系统在可适应性和灵活性方面还有很大的不足,本文针对Synchroflow工作流管理系统提
随着PDA等智能终端的不断普及和互联网的飞速发展,利用手机或PDA等智能终端浏览网页、上网购物越来越成为引领现代人生活的时代潮流,人们在充分享受着互联网所带来的方便和高
近年来,随着科学技术日新月异的发展,计算机向着高性能、微型化方向发展的速度也越来越快。半导体技术的提高和嵌入式技术的应用,使得传统意义上的计算机已缩小至板级、芯片
1990年12月25日Web上线,1993年3月15日图形浏览器诞生,人们由此开始彻底改变了网上查阅信息、获取资料的习惯,Web已经成为人们获取信息的一条重要途径。由于Web页面的日益增加,获
软件测试在整个软件开发过程中占有非常重要的地位,是保证软件质量、提高软件可靠性的关键。随着软件设计技术的发展、软件规模的增加、软件开发周期的缩短、软件测试工作量