模式分类中的特征选取问题研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：kefamz

【摘要】

：

本文在模式分类的背景下，对特征选取的一些问题进行了深入研究，主要工作如下。 1)粗糙数据模型是Kowalczyk提出的一种广义粗糙集模型，具有结构简单、实用性强的优点，但也存在

【作者】

：

黄金杰

【机构】

：

上海交通大学

【出处】

：

上海交通大学

【发表日期】

：

2006年期

【关键词】

：

模式分类特征选取机器学习数据挖掘支持向量机

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文在模式分类的背景下，对特征选取的一些问题进行了深入研究，主要工作如下。 1)粗糙数据模型是Kowalczyk提出的一种广义粗糙集模型，具有结构简单、实用性强的优点，但也存在建模效率低、分类精度和噪声数据处理能力严重依赖于数据空间的栅格划分的弱点。为此，文中引入了模糊自适应聚类技术，将数据空间的硬划分转化为与模式类相适应的模糊划分，提出了一种基于粗糙集理论的规则模式分类器模型——模糊粗糙数据模型。该模型能够用较少数目的模糊类反映出数据集中具有超椭球、超平面或超线型的特征模式类，有效地提高了分类器模型的建模效率和数据概括能力。不同数据集的实验测试结果验证了该模型的优良性能。 2)互信息是特征选取问题中一类非常有价值的特征评价准则，但却存在高维空间下难以计算的困难。针对这一问题，论文首先对各种特征评价准则进行了系统研究，在此基础上，推导出了高维特征空间在信息均匀分布条件下，候选特征f<,i>与输出类别C之间在给定已选特征子集S情况下的条件互信息I(C；f <,i> |S)的近似估计公式。利用该公式，可以在特征信息不严重背离均匀分布的情况下对特征进行有效地评价。基于该估计公式，提出了一种基于已选特征子集二阶互信息的特征选取Filter算法(SOMIFS)，该方法能够自适应地估计出候选特征与已选特征之间关于输出类别的冗余信息，不再象Battiti的MIFS方法及Kwak和Chow的MIFS-U方法那样，需要预先人为设定与特征冗余程度有关的参数β的数值，从而大大改进了算法的性能。另外，针对特征信息任意分布的情况，给出了一种基于互信息的构造性特征评价准则；基于该评价准则，进一步提出了特征信息任意分布条件下的构造性特征选取方法(MICC)。通过在不同的解析数据集和基准数据集上的测试与比较，实验结果表明，与Battiti的MIFS及Kwak和Chow的MIFS-U等特征选取方法相比，本文所提方法SOMIFS和MICC能够提供更加准确、有效的特征评价准则，具有更强的适应性和更好的预测性能。 3)在输入特征之间存在复杂关联关系的情况下，使用单一评价准则的filter方法由于存在“嵌套”效应等弱点，往往难以发现最优特征子集。针对这一问题，文中提出了一种基于互信息、以filter为局部搜索方式、以混合遗传算法为优化组织形式的特征选取Wrapper方法。该方法将遗传算法的全局搜索能力强、filter方法的计算速度快和wrapper方法的预测精度高等三方面的优势，以互信息为纽带完美地结合在一起，该使得该方法具有很强的最优特征子集搜索能力。不同类型的数据实验研究表明了该方法不论在分类预测精度上，还是在适用性上都具有很好的性能。 4)研究了特征选取的应用问题，分析了影响特征选取算法选用的因素及其相互关系，对合理选用特征选取算法具有一定的参考意义。

其他文献

基于DSP的图像预处理算法研究与实现

本文以电视制导为背景，研究了用于电视导引头上图像处理机的图像预处理技术，为武器系统的研制与试验提供理论准备与技术支持。本系统根据处理机对图像能实时处理的要求选择

学位

电视制导图像处理数字信号处理器参考架构缓存优化

磁浮列车悬浮系统建模及悬浮控制策略的研究

磁浮铁路系统的商业成功运营预示着其广阔的市场前景。高速磁浮列车的超高速运行对其安全性能和运行控制系统提出了极高的要求。当高速磁浮交通系统在启动那一刻开始,就需要

学位

磁浮列车悬浮控制电磁铁反馈线性化滑模控制

切换系统的鲁棒可靠控制若干问题的研究

切换系统是一类重要的混杂系统，它有着广泛的实际背景。同时，系统在运行过程中，系统内部元件不可避免地发生故障，因此对其可靠性的要求越来越高。由于切换系统本身的复杂性，可靠控

学位

切换系统切换时滞系统非线性系统执行器失效平均驻留时间混杂系统状态反馈

光纤光栅隧道监测系统的研究

本文以光纤光栅隧道监测系统的设计和应用为目的，进行了以下几方面的研究。文章介绍了光纤光栅的发展历史以及在传感方面的应用现状，对光纤光栅的传感理论进行了分析，分析了

学位

隧道监测光传感器光纤光栅

基于UML的人力资源管理系统建模研究

软件项目建模的三要素是建模过程、建模工具和建模符号。建模过程提供正确的建模流程；建模符号用于建模过程的表示，也是一种交流语言；建模工具使建模过程与建模符号有机地结合起

学位

面向对象统一建模语言人力资源管理可视化建模

嵌入式系统在检测和控制方面的应用

随着信息化、智能化、网络化的发展，嵌入式系统技术获得了广阔的发展空间。小到MP3、PDA等微型数字化产品，大到网络家电、智能家电、车载电子设备等，目前，各种各样的新型嵌入式系

学位

嵌入式系统控制器报警器光伏电池

晶振外壳冲压品质视觉抽样检测系统的研究

晶振外壳主要用来屏蔽外界的电磁波对晶振的干扰。因此，晶振外壳的表面品质在很大程度上决定了晶振作为电路的基准时钟源能否正常的工作。本论文结合光源照明、气动控制和图像

学位

晶振外壳机器视觉抽样检测机电控制信息熵

基于运动控制板卡的二维交流伺服系统研究

随着运动控制技术的发展，永磁同步电动机(PMSM)位置伺服系统在数控机床、工业机器人等高精度、高性能场合的应用越来越广泛。在新一代运动控制系统中，要实现高速度、高精度、高

学位

运动控制卡交流伺服系统半闭环控制方案二次开发硬件特性

无模型自适应控制理论在液位控制系统中的应用

本文的主要工作是将不依赖于被控对象数学模型的无模型自适应控制理论应用到液位控制系统之中，提出基于无模型自适应控制理论的改进Smith预估算法。并对实际液位单容系统和双

学位

液位控制系统增益自适应参数估计算法延迟时间常数

现场总线控制系统组态软件的研究

随着工业自动化水平的提高，以及计算机技术的广泛应用，人们对工业监控软件的通用性和灵活性提出了更高的要求。传统的工业控制软件是由用户通过手工或委托第三方编写HMI应用，开

学位

组态软件多线程图形组态驱动程序DLL实时数据库

模式分类中的特征选取问题研究

与本文相关的学术论文