基于遗传算法的分类规则挖掘研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:WSZYC
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是近年来兴起的一个新的研究领域,它综合了数据库技术、人工智能、统计学等多个学科,最终目的是从大量的数据资料中发现有价值的信息和知识,即蕴涵在数据中的信息,从而达到为决策支持的目的。分类规则挖掘则是通过对训练样本数据集的学习构造分类规则的过程,是数据挖掘、知识发现的一个重要方面,其实质是希望得到高准确性、易于理解的和有趣的分类规则。遗传算法是一种基于生物进化论和分子遗传学的全局随机搜索算法。本文对基于遗传算法的分类规则挖掘进行了研究,并在此基础上,提出了基于相似度的交叉变异算子,改进了种间竞争遗传算法,并将它们应用到分类规则的挖掘中。论文首先回顾了数据挖掘的历史背景,并对数据挖掘的基本概念、过程、特点、分类及任务模式进行了详细地归纳和总结,着重讨论了分类规则挖掘的步骤、技术和方法。此后,对遗传算法的生物由来、特点和理论基础进行了概述,总结了简单遗传算法的流程,三大算子和四大关键问题,并分析和讨论了简单遗传算法应用于分类规则挖掘中存在的“早熟”收敛现象发生的原因和一般的解决方法。接着,在简单遗传算法基础上,为了克服简单遗传算法“早熟”收敛的问题,引入“相似度”和“杂交优势”思想,将原来的交叉和变异两个算子合二为一,提出了一个新的遗传算子:基于相似度的交叉变异算子,并利用Breast cancer data数据集对其进行了算法测试。最后,改进了种间竞争算法,并利用adult数据集对其进行了算法测试。
其他文献
随着人类进入互联网信息爆炸时代,所接触的信息种类也越来越多。比如从最开始简单的文本信息,发展到随后的音频信号,再到现如今含有丰富内容的图像。人类获得信息的途径越来
网络业务自相似性的发现对网络业务建模、性能评价和网络控制技术的研究产生了重要影响。传统的网络模型在描述实际网络业务时,认为网络通信量具有Markov性,并在此基础上建立了
随着Internet的普及,电力企业网络安全问题日益突出,信息网络的安全将直接影响电网的稳定运行,PKI和PMI技术是电力企业中广泛应用和推广的认证和授权方式。本文以PKI/PMI为基
随着Internet的迅猛发展,因特网业务已成为多媒体通信业中发展最为迅速、竞争最为激烈的领域。通常情况下,多媒体通讯需要很大的带宽,而组播通信模型可以减轻服务器的负载并
地形信息的可视化在实时仿真和地理信息可视化系统中,占有十分重要的地位。然而随着遥感技术,卫星技术的发展,使得获取高分辨率的数字几何高程数据以及影像纹理数据成为可能,人们
本文首先介绍了Internet中存在的网络拥塞现象、拥塞控制策略的研究现状以及传统拥塞控制技术所面临的一些困难;在研究MA(移动代理Mobile Agent)技术的基础上,提出了一种基于
本文以作者参与的四川建设网电子招投标系统开发项目为背景,提出了基于Web的公开招标子系统的完整解决方案。论文以软件工程思想为指导,以MVC模式为设计方法,经过业务需求分析、
随着互联网的迅速发展,网络安全问题越来越受到人们的重视。攻击者知识的日趋成熟,攻击工具与手段的日趋复杂多样,单纯的防火墙策略已经无法满足当前的需要,网络的防卫必须采用一
软件开发模式已经从集中式发展到松散的、异地的、分布式开发活动,越来越体现出多角色参与、多环节配合的工程项目特点。异地协同软件开发过程中的流程更加地相互影响、交叉和
软件复用是软件业界为解决日益严重的“软件危机”和日趋复杂的软件需求而提出的一种对策。软件复用技术随着面向对象技术而得到迅猛的发展。在当前的软件技术领域中,基于构件