一种改进的关联规则挖掘技术研究

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:yeyuxx008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息时代的今天,如何有效地利用大量的原始数据来分析现状以预测未来,已经成为人类面临的一个重大挑战。数据挖掘是致力于数据的分析和理解、发现数据内部蕴含的大量知识技术。目前,数据挖掘已经成为当今学术界的一个研究热点,同时,关联规则挖掘是数据挖掘技术中最活跃的研究方法之一。它是用于发现数据库中不同项目集之间的关系,而怎么快速发现频繁项集是关联规则数据挖掘技术的一个核心问题。   如今,关联规则已经被广泛应用于各个领域,但是算法效率不高,并且会产生很多冗余规则,本文针对此问题,根据关联规则挖掘的要求和特点,结合RS理论的属性约简方法和进化算法的思想,提出了一种改进的关联规则挖掘方法,该方法是是把关联规则挖掘过程分成两阶段处理,第一阶段,是利用RS属性约简技术对决策表进行冗余属性约简,第二阶段是对约简后的决策表利用进化算法进行关联规则挖掘。最后通过实例验证改进后的方法具有高实用价值,并且可以很好地解决原始方法中存在的问题。本文的主要工作概括如下:   1.对关联规则挖掘技术的定义,性质、挖掘算法、挖掘过程及其研究状况进行介绍,并详细讨论了经典的Apriori算法,和运算过程不产生频繁项集的FP-growth算法。   2.提出了一种改进的差别矩阵属性约简算法,其思想是从原始的差别矩阵属性约简方法上进行反思想约简,目的找出对决策影响很小,甚至没有影响的属性,然后删除,较以往的算法意义更加直观,计算也更加简单,并且在一定程度上减低了存储空间要求和提高了约简算法的速度。   3.提出了结合RS属性约简方法和遗传算法(Gas)的关联规则挖掘模型,从它的编码方法、适应度函数的构造、遗传算子的设计等方面都进行了详细的讨论和分析。最后,用实验数据证明该方法的可行性、有效性。   4.针对传统GAs收敛速度慢和交叉算子和变异算子带来的盲目性和随机性的问题,本文还讨论了一种在Gas基础上发展起来的新型进化优化算法,即分布估计算法(EDAs)。该算法具有良好收敛性能的同时,具有很好的维持群体多样性的能力。并把该算法与RS属性约简方法应用到关联规则挖掘上,取得了很好的效果。
其他文献
随着互联网的高速发展,网络对安全保障提出了更高的要求。传统的安全技术主要是通过修补漏洞、安装防火墙、防御外部攻击等防御手段来抗击计算机外部的病毒、黑客的攻击和入
句法分析是自然语言处理的基本任务之一,是语义理解、问答系统等自然语言理解任务实现的基础。本文根据已有的现代汉语虚词用法知识库,初步探讨了基于汉语虚词用法的短语边界
当前,XML(可扩展标识语言)已经成为万维网的数据表示和数据交换的标准。随着XML数据越来越多,针对XML数据的查询与处理引起了越来越多的关注。近来,大量基于将XML文档视作树
近年来,随着对Bag of visual words(Bo VW)模型的不断研究,使得其在图像处理领域得到广泛的应用。由于图像在人们生活工作中发挥着不可或缺的作用,因此如何在庞大的图像数据
随着国内3G网络的开通,高速的3G无线网络给人们的生活带来了很大的便利。各种3G网络终端设备也开始应用于人们生活的方方面面。3G无线网关作为一款全无线工作模式的网络终端设
无人机在军事和非军事领域的广泛应用使飞行控制技术成为国内外的研究热点。地面站是飞行控制系统的重要组成部分。因此,研究适应不同任务需求的地面站对飞行控制系统的工程研
近年来,随着高清、超高清视频(分辨率达到4kx2k、8kx4k)应用逐步走进人们的视野,视频压缩技术受到了巨大的挑战。此外,各种软硬件的不断更新换代也使多种多样的视频应用不断
在诸如人工智能、机器学习、模式识别和数据挖掘等许多研究领域,智能系统中的知识,既有规律性的一般原理,又有大量的不完全的专家经验知识,这样的知识不可避免地带有随机性、
随着电子信息技术的发展,新的信息以一种前所未有的速率在产生和处理,同时网络也大大加快了信息传播的速度,这使得对海量信息的处理成为了人们的一种迫切需求。仅仅使用本地存储
运动目标检测与跟踪是计算机视觉研究的基础任务和关键技术之一,在视频监控、视频会议、人机交互等领域有着广泛的应用。论文针对背景模型变化、光照影响、前景背景颜色近似