遗传算法在分类算法中的应用研究

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户：liuhu8207

【摘要】

：

近年来，数据挖掘引起了社会的极大关注，主要是随着互联网的发展，以及我们产生和收集数据信息的能力不断提高，电子信息的数量与日俱增，已经庞大到了难以在大量数据中提炼出关键信息

【作者】

：

韩增新

【机构】

：

中国地质大学(武汉)

【出处】

：

中国地质大学(武汉)

【发表日期】

：

2012年期

【关键词】

：

数据挖掘遗传算法分类算法朴素贝叶斯参数优化

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来，数据挖掘引起了社会的极大关注，主要是随着互联网的发展，以及我们产生和收集数据信息的能力不断提高，电子信息的数量与日俱增，已经庞大到了难以在大量数据中提炼出关键信息的地步。而数据挖掘就是一门将巨大的数据转换成有用信息的学科。　　而演化算法作为人工智能中的热门算法，也受到了广大学者的广泛重视。与传统算法相比，演化算法具有自组织性、自适应性、并行性、多解性、全局优化性、内在学习性、统计性和稳健性等特征，因此，演化算法的应用领域也比较广泛，也是当代多学科交叉的产物。　　本文的研究目标是综述遗传算法在数据挖掘分类算法上的应用，总结其规律和不足，并尝试提出遗传算法在分类算法上的新的应用点。本文在综述了大部分遗传算法应用方法后，特别的对朴素贝叶斯算法和支持向量机用于排序算法进行了创新的改良和实验，并取得了一定的效果。　　首先本文阐述了演化算法中最具有代表性的遗传算法的原理和特征，介绍其发展历史和研究现状等。从遗传算法的生物学基础、编码方式以及交叉、变异、选择等关键操作上做了比较详细的介绍和分析。　　然后本文阐述分析数据挖掘中的各有代表性的分类算法的原理思想、优缺点以及研究现状等，针对常见的6种分类方法进行详细的介绍。在UCI标准数据集上对6种算法进行对比实验，为后续的研究做好准备。　　之后本文归纳综述遗传算法在数据挖掘分类算法中的研究成果。对于SVM、神经网络、KNN等问题的遗传算法优化基本都属于参数以及结构的优化问题，而对于贝叶斯、决策树等算法的优化属于属性以及样本筛选问题，对于规则、模糊集、关联规则等的挖掘则是直接使用遗传算法发现。如果对于这些问题进行归纳、整理、分析，有助于发现和解决其中的共同点和存在的问题，研究遗传算法在分类算法中的使用规律。本文通过理论上的说明和分析，介绍了分类算法中的遗传操作。　　最后，结合已有的分类算法以及遗传算法的技术，尝试将遗传算法运用到新的数据挖掘分类算法上。本文提出了一种自适应的遗传算法应用在朴素贝叶斯文本分类算法的特征选择上取得了较好的效果，通过自适应的遗传算法的选择得到的新的特征下使用相同的训练样本，可以训练出分类准确率更高的朴素贝叶斯分类器模型;本文还提出一种将遗传算法应用在RankSVM算法的参数优化中的方法，通过遗传算法优化的RankSVM的容错率参数，使得RankSVM训练出的模型计算得到的结果NDCG得分得以提升，取得了较好的效果。

其他文献

基于WiFi技术的室内定位系统研究

随着无线技术、移动计算和因特网应用的不断增长，位置感知系统引起了人们浓厚的兴趣。全球定位系统(Global Positioning System，GPS)是目前应用最广泛也是最成熟的一种定位系统

学位

室内定位系统WiFi技术指纹识别校准模型评价标准过滤算法

基于J2EE的成本管理系统的设计与实现

目前,随着网络技术的快速发展和J2EE平台的广泛应用,越来越多的企业采用基于B/S架构的管理系统,而在企业管理系统中,成本管理系统是一个重要的组成部分。成本管理的对象是与

学位

成本管理系统J2EEStrutsSpringHibernate

Ophone平台下基于P2PSIP的即时通讯系统的设计与实现

本篇论文首先从智能终端系统下的网络应用这一背景出发,分析了当前移动互联网时代即时通讯系统的发展,同时简单介绍了当前流行的两个协议SIP和P2P,并阐述了它们的特点和各自

学位

智能终端会话初始协议对等协议即时通讯

瞬间的思考

瞬间,在西方摄影记者眼里,是第一位的。他们遵循着这样的哲理:人类历史是由无数瞬间构成的。本刊这一期发表的第32届荷赛几张杰作,都是几个绝妙的瞬间。这些用三只眼睛看世

期刊

摄影记者三只眼睛看世界使人新闻摄影作品事件性一念之间突发新闻王正桂骚乱事件

高中数学课堂教学中师生有效互动的实践与探索

传统的高中数学教学模式中,学生只是教师施加外部知识刺激后的被动吸收者,普遍存在课堂学习效率低下的问题.而在探究课堂教学中师生有效互动策略时不难发现,课堂应当是学生的

期刊

高中数学课堂教学中师生互动策略学生建构知识体系效率低下外部知识巧妙设计课堂学习教学培养教学模式教师及时评价多维互动创新人才主战场

多媒体信息技术合理运用于高中数学课堂的作用

信息技术的飞速发展,推动了教育从目的、内容、形式、方法到组织的全面变革.站在教育第一线的教师,完全有必要对教学过程重新认识.《基础教育课程改革纲要(试行)》指出:“大

期刊

多媒体信息技术合理运用教学过程数学思维基础教育课程改革纲要学习工具教师课程的整合机辅助教学概念的形成重新认识学习方式学生学科特点形成

例析导数法在高考复习中的严谨性的缺失

1.“单调性概念理解”的严谨性缺失书本定义:设定义在某区间上的函数y=f(x),如果f’(x)>0,那么函数y=f(x)在这个区间内单调递增;如果f’(x) 0, then the function y = f This

期刊

导数法高考复习函数单调递增递增或递减概念理解单调区间单调递减充分条件严谨性单调性书本

无线传感器网络故障探测技术研究

无线传感器网络(Wireless Sensor Network, WSN)由大量、微型、廉价,具有无线通信能力的传感器组成,节点被部署在监测区域后相互协作完成监测任务。WSN因其监测精度高、容错

学位

无线传感器网络故障探测能量效率探测准确度

基于嵌入式系统的碟式太阳能热力发电跟踪系统的设计与实现

人类社会的一切活动都与能源密切相关。目前人们对能源的需求主要依靠化石能源，但由于化石能源本身的储量有限，且大量使用化石能源会对环境造成负面影响，故近年来人们一直在寻找

学位

嵌入式系统太阳能热力发电跟踪系统系统稳定性自动控制逻辑

也议高中数学之“拐科”

数学,无疑是一门最基本的、最重要的主打学科,它贯穿于中小学全过程,甚至追随终身.而高中数学,是初中数学理论上、实用上的升华和延伸,不仅在现实生活中具有很强的实用价值,

期刊

高中数学学生学科数学理论拉开距离高考中小学全过程高中生营养无味生理升华科目价值初中

遗传算法在分类算法中的应用研究

与本文相关的学术论文