遗传算法在数据挖掘中的研究与应用

来源 :中南大学 | 被引量 : 0次 | 上传用户:a8586023
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是随着信息技术不断发展而形成的一门新学科,是数据库领域出现的一个新兴的研究热点。关联规则作为数据挖掘领域的一个重要研究分支,针对关联规则挖掘中经典算法-Aprior算法的局限性,在划分技术的基础上提出了一种基于遗传算法的关联规则挖掘模型。分类是数据挖掘中最重要的方法之一,决策树作为发现分类模型的常用技术现已被广泛研究并取得了很大的进展。然而,在决策树的构造过程中采用贪心算法,造成了决策树容易过分拟合、规模过大、产生的规则长度过长等缺点。针对这些缺陷,提出了一种基于遗传算法与关联规则算法的混合分类挖掘方法。研究工作围绕着遗传算法应用于数据挖掘研究展开,基本上分为四部分:(1)对KDD(Knowledge Discovery in Database)技术进行了总体上的概述,包括KDD的含义、一般过程、主要方法和技术、研究的现状及存在的问题等,为在这一领域进行更为深入的研究打下初步基础。在此基础之上对发现分类模型的各种技术以及关联规则挖掘算法进行了较为全面的研究。(2)对遗传算法的编码方法、适应度函数、遗传操作算子、参数的选择作了全面且深入的研究。(3)对提出的基于遗传算法的关联规则挖掘方法进行了全面的描述。(4)对提出的基于遗传算法与关联规则算法相结合的混合分类方法进行了全面的分析。最后,总结了遗传挖掘的特点,并进一步讨论了未来的研究方向。
其他文献
随着云计算、大数据技术的发展,互联网产生的数据呈爆发式增长。企业和政府机构拥有的数据越来越多,他们开始重视数据价值的挖掘和应用,于是以电子方式存储的海量数据的安全问题
随着网络技术发展的日新月异,网络规模迅速扩大,特别是进入90年代后,以IP为基础的Internet呈现出爆炸式增长,Internet己逐渐发展成为全球性的信息基础设施。随着新型网络应用
随着数据库技术的广泛应用,产生了大量分散在各个行业的数据。面对大量繁杂而分散的数据资源,如何有效地管理和重组数据资源,提炼出有价值的信息以供决策使用,成为数据库发展面临
由于故障信号存在数量冗余、不准确、不完整等现象,导致了基于神经网络的故障诊断专家系统的网络结构输入维数大,结构复杂,冗余部分多,因此网络训练速度慢,不易收敛,推广能力
对现代化的制造业企业来说,如何使企业的信息更加易于管理,使企业运行效率更高,以及如何减少企业的运营成本等都是现代企业面临的主要挑战,在制造业企业加快信息化步伐的过程中,对
嵌入式系统的设计和实现朝着基于芯片,特别是系统级可编程芯片(SoPC,System On a Programmable Chip)的方向发展。基于FPGA的片上可编程系统技术逐渐成为嵌入式系统技术发展的
本文的研究对象一水下滑翔机器人嵌入式控制系统是为了满足水下滑翔机器人的开发需要而设计的。在深入分析水下滑翔机器人控制系统特点的基础上,本文提出了水下滑翔机器人嵌入
近年来,无线通信技术迅速普及,“随时、随地、访问任何网络资源”无疑对移动用户有着巨大的吸引力,在新一代无线移动互联网络(wireless mobileInternet)技术的发展过程中,无线局
随着工艺,贸易趋势的进步,交易方式同时也在改变。许多业务应用也在不停的发展以及改变来发展业务方式以及机构。这些变化很明显,日益增快甚至企业难以跟得上这些变化。因此
随着交通运输产业的迅速发展,它与社会生活的联系越来越紧密,这使得人们开始日益关注运输成本问题。动态车辆实时调度是降低运输成本的一种科学方法,它可以减少车辆空驶率,降