基于森林优化算法的特征选择方法研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:likezzz21cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展,各行各业每天处理的数据量呈指数增长,数据的维度越来越大。而这些数据中存在着大量的冗余、不相关的特征,这些特征给机器学习、模式识别和数据挖掘带来了巨大的挑战。学习算法在处理高维数据的情况下,往往会碰到性能问题。特征选择作为解决这个问题的有效手段一直都被广泛的关注。在特征选择方法的发展过程中,涌现了许多有效的优化算法,而森林优化算法(FOA)就是其中的一种新兴的方法。森林优化算法受大自然森林演变过程启发而来,该算法模拟森林演变过程。它具有简单、易实现、收敛速度快和搜索效率高等特点。虽然基于森林优化算法在解决特征选择问题上取得了较为满意的结果,但是仍然存在着一些不足。本文是在所提出不足的基础之上,对基于森林优化算法的特征选择算法(FSFOA)进行改进。本文主要做了一下的研究工作:首先,提出改进的基于森林优化算法特征选择。该方法引入了一种贡献度的策略嵌入在森林优化算法中。其主要目的是引导森林优算法根据类相关性和特征冗余度去搜索最优解,从而提高了森林优化算法在特征选择问题中的搜索效率。其次,根据当前树和当前全局最优树的关系,提出了距离自适应策略。该策略能够有效地快速地引导算法搜索最优树,加快了算法的收敛速度。为了避免算法陷入局部最优解,对适应度函数进行了改进,这使得森林优化算法在选择特征的时候不仅考虑了整个特征子集的表现,而且还考虑了特征子集中每个特征的质量。我们从UCI数据集中选择了 10个常用于验证算法有效性的数据集,并与近年一些特征选择算法进行了实验对比。实验结果表明我们所提出算法要优于这些特征选择的方法。其次,提出了一种局部搜索策略的森林优化算法的特征选择。该方法利用局部搜索策略引导森林优算法在搜索最优树的过程中尽可能多的选择高质量的特征和尽可能多的剔除低质量的特征,从而很大程度上保证森林中每个特征子集具有较高的质量并且提高了算法的搜索效率。为了在初始化阶段森林中所有的树都处于较为理想的位置,利用特征子集大小确定机制对森林进行初始化,该策略能够保证在初始化阶段森林中每个特征子集所选的特征数量相对较少,从而很大程度上加快了算法的搜索效率。最后,实验结果证明了我们所提出算法的有效性。
其他文献
截止2017年,我国农业转移人口总量28652万人,其中,省内流动的农业转移人口数量达到20977万人,占流动人口总数的73.2%。推进农业转移人口城镇化关乎以“人的城镇化”为核心的新型城镇化目标的实现,是我国新型城镇化的重大任务。本文以社会质量为研究视角,分析影响农业转移人口就近迁移的因素。共选取31个社会质量测量指标,通过熵值法分别给31个指标赋权,然后通过描述性统计分析我国城镇社会质量现状,
工业三废分为废水、废弃和固体废弃物,对环境和人体的影响,阻碍我国工业企业发展也阻碍我国从工业大国发展为工业强国。本文对工业三废及污染进行了具体分类与解析,揭示了三
高校紧紧围绕"培养什么样的人,怎样培养人"这个重大课题,以社会主义核心价值体系为统领,通过有效开展志愿活动,探索出以"服务学生成长成才、服务经济社会发展"为主要内容的志
叶澜语录★⊙课堂是一种生活,怎样在这段时间里积极地、主动地展示生命活力,是我们的研究重点。⊙教育是直面人的生命、通过人的生命、为了人的生命质量的提高而进行的社会活
本文介绍了针对国产反动式及冲动式两缸两排汽300MW纯凝机组的通流及供热改造技术,在汽轮机通流改造的基础上兼顾供热需求、实施定制化的供热设计和供热改造,能最大限度的降
针对制导火箭弹滑翔增程问题,文章提出了以攻角为优化变量的解决方法;基于火箭弹的四自由度模型,结合粒子群优化算法,提出了火箭弹射程优化模型并建立了约束条件。对某制导火
坚持问题导向,是我们改革奋进、干事创业的重要思想方法和工作方法。以“改革创新、奋发有为”大讨论带动整体工作,就是一个从发现问题到解决问题的过程,这是省委、市委的要求,也
报纸
研究用果胶酶提高葡萄出汁率的方法及果胶酶对葡萄汁色泽的影响。通过单因素与正交试验分析酶添加量、酶解温度和酶解时间对葡萄出汁率的影响,结果表明:最佳工艺条件为:果胶
富营养化导致物种多样性丧失已成共识。营养资源添加扰动土壤——植物的化学计量比过程,对植物的生长发育产生影响。因此,本文从生态化学计量学途径探讨营养元素添加导致物种
1988年以来,我陆续创作拍摄了四部重大革命历史题材的故事片,还参与了几部同类题材的电视连续剧的创作.我感到,重大革命历史题材影视作品已经逐渐形成自己的创作生产规律,初