基于关联规则挖掘的KDD的研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:ysksy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
首先,该文就KDD的起源、概念、处理过程和研究现状进行了综述,并且简单介绍了几种主要的KDD技术.作为的研究重点,关联规则数据挖掘问题被提出,并且得到了详细的阐述.就如何解决关联规则挖掘问题该文介绍了三种经典算法:AIS算法、Apriori算法和DIC算法.其中,Apriori算法对候选集进行剪枝,大大减少了候选项目集的数量和计算时间,是关联规则挖掘算法中最具影响的一种.随后,在经典关联规则算法的基础上,该文提出了一种数据集划分算法DPARM.DPARM利用数据集中存在的概念层次对数据集进行划分,并分别从划分形成的数据块中进行关联规则的挖掘.通过实验得到以下结论:1)随着数据量的增大,该算法的挖掘效率优于Apriori算法;2)数据集划分的精度越高,该算法的挖掘效率越高.由于该算法比较占用系统内存,该文进一步指出了并行处理的改进思路.最后,就如何在关系数据库中实现关联规则的挖掘问题,该文提出了一个基于数据集市的关联规则挖掘系统,阐述了系统的框架结构和各部分实现中的关键技术.
其他文献
该论文介绍了作者在进行某中小型企业管理信息系统(MIS)开发过程中的实际工作,并由此对中小型企业管理信息系统的开发设计进行了研究,力图给出一个适于中小型企业的管理信息系
单神经元自适应PID控制是一种实现简单的智能控制策略,其神经元的学习通常使用有教师的Hebb学习规则。本文提出一种有教师的Oja学习规则,并将这种规则引入了神经元的自适应学习
该文以电容层析成像系统为研究对象,针对气固两相流图像重建、流型辨识、速度及其分布测量中的有关问题进行探讨和研究。
作者简要介绍了色谱工作站硬件部分的设计,较详细地介绍了色谱工作站软件部分的设计,并介绍了工业色谱仪项目中的谱峰处理部分设计与色谱工作站项目中该部分在设计中的不同.
企业过程建模作为一项支持企业过程集成与优化的共性技术,是对企业系统中与企业过程有关的特性加以抽象表达并动态仿真企业内部各种行为活动的一种方法,是企业过程集成成功的
半导体分立器件作为一种关系国计民生的支柱性产业,随着科技的逐步发展,在人们生活、生产中占据重要的地位。而分立器件大规模量产时,如何利用自动化检测设备实现自动化的测试,一
该文包括数据挖掘的基本概念、数据仓库的相关技术、数据挖掘的数据预处理技术(包括数据清理、数据集成和转换、数据归约等方法)、以及传统关联规则挖掘及Apriori算法、模糊
本文对手写体字符识别中的特征提取、距离分类方法以及识别系统的性能评价进行了研究。尤其是对一种新的统计距离方法:切线距离方法进行了研究和探索。在统计切线距离、基于奇
学位
可编程控制器网络是随着电子技术、计算技术、网络通信技术和自动化技术等的发展而产生和发展的.在工业实际应用中,不同可编程控制器网络系统的集成与拓展和远程控制的发展要
该文针对陶瓷胶辊印花机的印前工艺,运用激光雕刻直接制版技术,提出了一种数字印前系统的设计方案,并着重对系统中CAD软件的实现技术进行了论述.该文首先介绍传统印前工艺的