基于支持向量机的特征选择及其集成方法的研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:leonzhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机与网络技术的快速发展,大数据集的出现致使人们获取的信息量正在以前所未有的速度日益剧增,也导致大量不相关或冗余数据的不断涌现。因此,如何快速获取所需有用信息方面的应用研究,也日益倍受人们关注。目前,特征选择作为应用于数据挖掘中消除数据噪声的一种技术,也作为根据某一准则从原有的特征中选择出最优的特征组合实现对数据进行预处理的一种常用手段,已成为模式识别领域研究的一个热点。本文运用以具有良好泛化能力的支持向量机的特征选择和集成分类器新技术,在支持向量机分类的基础上,以特征选择和基于特征选择的集成学习方法为主要研究内容,以影响支持向量机性能的主要因素为研究对象,对正则化参数C和核函数参数的选择进行了较深入的研究,并通过对多个成员分类器结果的集成,以进一步提高对数据挖掘的学习泛化能力。研究成果主要体现在以下两方面:(1)设计了RGS算法。该算法首先利用ReliefF方法对样本集特征进行排序,然后,利用遗传算法优化特征子集。在遗传算法优化特征子集的同时,把支持向量机参数混编入遗传算法的遗传假设中,从而实现同步优化特征子集和支持向量机参数。最终通过实验证明了我们所提算法的有效性。(2)从成员分类器的差异度出发,提出了RGSE集成分类算法。此算法是以RGS算法为基础的组合分类器设计方案。该算法中主要是通过降低成员分类器之间的相关性,达到提高集成分类效果的能力,并通过实验证明了该算法的集成思路是优于Bagging和Boosting方法的。
其他文献
计算机技术和网络技术得到了不断的发展,计算机系统也从独立的主机发展到复杂的、互联的开放式系统,这种情况导致计算机及网络的入侵问题越来越突出,为了保护系统资源,需要建
本文以数字电视运营行业为背景,研究了数据挖掘技术在数字电视运营支撑管理系统中的应用范围和使用方式。以聚类算法CLARANS为重点,分析了该算法在处理大数据集时所产生的聚
现今的并行编程实践多采用锁等较低的同步机制访问共享资源,这种编程困难且易出错;新引入的原子区构造虽简化了编程,但支持其实现的软硬件技术尚不令人满意。我们课题组就同
随着计算机网络和多媒体技术的飞速发展,信息安全成为全社会的需求,其中信息隐藏技术作为信息安全的重要方面,近年来得到了很大的关注。而由于JPEG图像的广泛应用和它提够的
学位
从国家实行金税工程以来,国家税务管理不断加强,也形成了多项国家标准和规范。从2007年开始,我校税控系统项目组为国家税务局开发针对大型商场的税控系统,并编写了国标七规范
学位
随着传感网、物联网、泛在网和智慧地球等概念的提出,无线传感器网络做为计算机科学与技术中一个重要的研究领域,对他们的研究和发展具有一定的支撑性作用。无线传感器网络的
Web信息具有动态性、分布性和规模性的特点,未来的Web服务应该向人们提供智能化、个性化的服务,并且能够有效地解决现实问题。在当今Web背景下,单一推理技术已无法满足现实问题
学位
秘密共享是现代密码学的一个重要分支,是保障信息安全和数据保密的重要手段之一。利用秘密共享保存和管理秘密信息,一方面可以防止权力过于集中而被滥用,分散了责任;另一方面
车间流水作业调度问题是生产、调度领域的一个热点、难点,是许多实际生产调度问题的典型调度简化模型。总完工时间是一个重要的衡量指标,它的最小化能有效提高设备利用率、缩短
H.264是国际电信联盟与国际标准化组织联合推出的新一代视频编码标准。该标准采用了先进的编码技术,具有卓越的压缩性能,并且易于网络传输,能够满足多种视频应用的需求。因此
学位