基于进化计算的集成特征选择算法研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:acdef2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择是根据样本的分布特性,基于某种评价标准,从初始特征集空间中选取一个相关特征子集的过程。它能有效地剔除不相关或冗余特征,提高学习算法的分类性能和运行效率。然而,许多实际分类问题中的特征集往往包含大量的不相关或冗余特征,这些不相关或冗余特征不但会降低分类速度、扰乱学习过程,而且还会降低分类的性能。相对传统的特征选择方法具有的嵌套效应、关键参数难以设定、容易陷入局部最优等缺点,进化计算以其潜在的局部/全局搜索能力,在特征选择中得到了广泛而成功的应用。随着采样技术的发展,特征的维度急剧升高,且不同维度特征之间存在复杂的交互作用,这对基于进化计算的特征选择方法提出了新的挑战。
  本文的总体目标是研究和改善基于进化计算的特征选择算法能力,以选择较小的特征子集,同时提高分类性能。为了精确、稳定地提取与分类目标高度相关的特征子集,需要深入地研究和设计新的特征选择方法。本文旨在基于进化计算,从特征选择目标个数(单目标/多目标),搜索机制,集成等方面对特征选择算法进行了研究,主要工作概括如下:
  1.针对高维度大规模数据中存在大量的不相关、冗余特征及计算量巨大等问题,设计了一种基于协同进化两段式分解的特征选择(CCFS/TD)算法。该算法综合采用两段式分解策略和协同进化技术以降低数据维度,同时使用差分进化算法搜索特征子集。为了解决单独的进化算法或协同进化在处理高维问题时,保留下来的特征数目较多的问题,设计了一种新的分解策略。该策略将传统的进化过程逐级分解为多个依次相连的进化过程,并通过在特征维度上随机打乱顺序使得特征在每个子进化过程中都能组成不同的组合,从而使特征之间可以信息交互。实验表明,针对不同类型的高维数据,CCFS/TD算法能够有效地降低特征维度且选择最优特征子集,获得了较好的分类性能。
  2.针对特征选择问题中存在多个最优或次优特征子集的情况,提出一种适应度欧式距离比的差分进化集成特征选择(EFS_FERDE)算法。为了尽量避免单一特征子集所构建的分类模型容易产生过拟合,研究采用FERDE多模态优化算法作为特征子集的搜索方法,以获得多个差异度较大且分类精度高的最优或次优特征子集;然后对每个特征子集训练构建个体分类器并进行集成,最后通过投票法得到强分类器。实验结果显示,EFS_FERDE算法具有较好的稳定性和泛化性能。
  3.针对特征选择中的多模态和多目标特性,设计了一种多模态多目标的集成特征选择(EFS_FERDE_MO)算法。在特征选择中,决策者希望使用最少的特征获得满意的分类精度,因此可以将特征选择问题看作具有两个待优化目标的多目标优化问题,找到两个目标之间最优折衷解集。但在这个最优折衷解集中可能存在不同的特征组合,它们具有相同的特征个数,且使用这些特征组合可以达到相同的分类精度。本文通过将非支配解引入FERDE多模态优化算法中,并将其作为特征子集搜索方法,以找到多个帕累托最优解集。
其他文献
学位
学位
学位
作为一种被广泛使用的交通工具,飞机的飞行安全对人们的生命安全和社会经济发展具有重要的意义。但由于飞机自然老化以及长期处于各种极端环境下,飞机不可避免的存在各类损伤,也因为这些损伤导致了一系列飞行事故。飞行事故的成因有很多,其中,飞机蒙皮表面的紧固件腐蚀损伤是一个不可忽视的因素。目前,对于飞机蒙皮表面损伤的检测,国内外的研究焦点主要集中在裂纹和划痕等由意外导致的损伤检测,而忽视了飞机上必然存在的腐蚀
学位
二维正系统由于其在电路分析、数字图像处理以及火电工程等领域均有着重要的理论意义和广泛的工程应用,一直是一个有趣而富有挑战性的研究方向,从而吸引很多学者的高度关注并取得了大量的研究成果。但是,到目前为止,对于正系统的研究成果大量出现在一维系统中,对于二维正系统缺乏系统的研究,成果也比较有限,也就是目前二维正系统的研究现状推动着作者进行此方向的研究。本文主要研究内容涉及如下三个部分:第一部分:主要对二
学位
舰载机着舰过程中存在如下控制问题:低动压稳定飞行控制问题、甲板跟踪及舰尾流抑制问题、着舰阶段操纵耦合问题。为解决舰载机着舰阶段控制问题,参考美国“魔毯”控制系统并分析其关键技术机理,设计了飞行轨迹速率控制模式以及飞行轨迹增量控制模式的控制系统。首先对舰载机和着舰环境进行非线性建模,并对舰载机动态特性进行分析。针对着舰阶段设计了常规着舰控制系统,并引入舰尾流和甲板运动扰动进行仿真分析。仿真结果显示常
学位
倾转旋翼飞行器既有直升机的垂直起降功能,又有定翼机的高速巡航飞行能力,融合了两种飞行器的优点,在军民领域的用途将非常广泛。本文以XV-15为原型,针对横列式双倾转旋翼机,对三模态统一机理建模修正改进与模型特性分析,开展全模态纵垂向飞行控制策略的研究,设计合适的过渡段转换方案,使倾转旋翼机在满足高度、前飞速度等限制的情况下,安全、平稳、高效地完成从直升机模式到定翼机模式的动态转换。首先,在课题组已有
学位
高超声速飞行器(Hypersonic Flight Vehicle,HFV)具备飞行速度快、远程精确打击等显著优点,具有非常重要的经济和军事应用价值。目前,多个国家相继开展了相关的地面和飞行试验,HFV已成为军事领域的研究热点。但同时,HFV的非线性、多耦合、多约束、多不确定性等特点给控制器的设计增加了难度。本文以障碍李雅普诺夫函数(Barrier Lyapunov Function,BLF)和自
学位
为了适应装备发展的智能化、集成化以及复杂化等特点,在产品设计阶段进行测试性设计和故障检测与诊断方法设计是不可避免的重要步骤。测试性是指产品能及时准确地检测并确定其工作状态(可工作、不可工作或性能下降)且隔离内部故障的一种设计特性。故障检测与诊断技术对于提高工程系统的可靠性并降低运行风险有重大作用。故障诊断策略优化设计作为测试性设计和故障检测与诊断的交叉课题,目的是以最小的测试代价生成测试序列的一种
学位
随着航空航天,智能设备等现代化系统的结构越来越复杂,系统各部分发生故障的可能性也较高,细微的故障便可能会导致系统性能下降,甚至变的不稳定,从而引发严重的生产事故和巨大的经济损失。因此为了保证现代系统的安全性和稳定性,针对系统容错控制的研究受到了越来越多的关注。挠性航天器作为一类复杂的航天器系统,针对复杂的系统结构和模型,通过简化其模型从而简化容错控制方法具有很重要的实际价值。本文首先针对挠性航天器
学位