支持向量机相关算法的鲁棒性研究

来源 :南京林业大学 | 被引量 : 0次 | 上传用户:jedy2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机作为一种数据挖掘方法,一直以来因为较强的泛化能力而被广泛的应用于社会各个领域。然而,支持向量机需要求解带有不等式约束的凸二次规划问题,并且具有训练时间长、计算量大的缺点,所以无法处理大规模数据问题。另外,支持向量机可以采用核函数来处理非线性分类,如XOR分类,但选择合适的核函数却是困难的。后来,孪生支持向量机(TWSVM)的提出,不仅缩短了训练时间,还能更有效的解决异或类型的数据分类,但它的目标函数仍是基于L2范数。二次规划问题中因为L2范数对于噪声数据敏感,一旦数据中含有较多噪声数据,那么算法的性能就会大大降低。因此,本文在基于TWSVM算法的基础上,为了提高算法的鲁棒性与分类精度,提出了三类算法,主要工作概括如下:1.在TWSVM算法的基础上,本文提出了一种新的具有鲁棒性的切L1范数孪生支持向量机(CTWSVM)算法,它不仅保持了TWSVM原有的优点,并且提高了算法的分类精度。在目标函数中,实验引入了切L1范数来度量点到平面的距离,它在计算时会根据给定阈值来判断数据点是否为噪声点,若被视为噪声数据,则会被“丢弃”并排除计算,以此来缓和异常值对分类平面的影响。此外,我们通过使用新设计的有效迭代算法来求解切L1范数的问题,对算法的局部最优解的存在和收敛性进行了理论分析,并通过对人工数据集和UCI数据集的大量实验证明了提出的CTWSVM算法的稳健性和可行性。2.在CTWSVM算法的基础上,为了减少算法的训练时间,引入了最小二乘的思想。在此,提出了新的算法-切L1-LSTSVM算法,它不仅大大减少了计算开销,还提高了算法的鲁棒性。同样地,本文采用了简单有效的迭代算法来求解该问题,并且从人工数据集和UCI数据集的实验验证了该算法的抗噪能力和可行性。3.为了进一步的提高算法的鲁棒性和增加算法的灵活性,本文将切Lp范数引入到最小二乘支持向量机(LSTSVM)中,使算法能够应用于范围更广的数据。同样地,本文设定了合适的阈值来减少噪声数据的影响,并从理论上推导证明了算法的可行性。最后,实验采用了人工数据集和UCI数据集,通过引入不同的高斯噪声比,与其他类似的分类算法进行比较分析,其结果证明了该算法的抗噪能力。
其他文献
N-糖基化是重要的蛋白质翻译后修饰之一,通过共价键结合到蛋白质上的N-寡糖除了辅助新翻译的多肽链正常折叠外,还具有维持蛋白结构稳定与活性、介导细胞之间信息传导等功能。在人体中,几乎所有的细胞表面糖蛋白和分泌蛋白都是复合型N-糖链修饰的糖蛋白,这意味着复合型N-糖链修饰对人源蛋白有不可替代的作用。为深入研究糖链与蛋白之间的相互作用与影响,需要在体外获得大量均一的复合型N-糖链修饰的蛋白。现阶段,除了
小麦穗的分化与发育是生殖器官建成的重要时期,也是产量和品质形成的决定性因素。研究小麦穗部发育相关的基因,对于揭示穗部发育的遗传机理以及对产量性状的遗传改良有重要的
调查显示50%的电话和70%的无线数据设备在未来会发生在室内环境。低传输功率和低成本的家庭基站是应对业务增长需求的可行手段。异构无线网络通过在宏蜂窝下部署家庭基站来提
不同基因型烤烟对钾素的吸收能力不同,对钾素的需求量也不同。深入研究烤烟不同基因型对钾素吸收和积累差异的机理及遗传特性,对于选育高钾基因型烤烟,提高钾肥利用效率具有
企业家是市场经济的主体,是创造社会财富的核心人物。企业家人力资本素质是企业间绩效差异的重要来源,同时也是推动经济增长和社会进步的主要力量。企业能否进一步发展壮大,
视频监控系统已被广泛应用到生活和生产中,例如安保、交通、国防等。但是由于现有系统的局限性,在一些环境较为恶劣的地区,系统建设需铺设强电和弱电两套系统,其安全性和可靠
在工业测量领域,获取物体表面的三维信息重构模型是进行后续分析和决策的基本步骤,这一步骤也是对振动物体进行测量的先决条件。传统的接触式测量方法由于测量方式的限制,只
目的:通过干扰及过表达RNPC1基因,研究RNPC1基因对恶性黑色素瘤细胞A375增殖、迁移及侵袭的影响。材料和方法:在恶性黑色素瘤细胞A375中构建RNPC1基因过表达(O组)及短发夹RNA
目的:具有α-取代的3,6-二氢-2H-吡喃这种骨架的化合物广泛存在于人们的生活中,是许多生物活性天然产物和合成药物中常见的结构基序。因此快速高效得到这类化合物对我们来说具有十分重要的意义。目前已经建立了许多方法获得具有不同取代模式的α-取代的3,6-二氢-2H-吡喃骨架,α-取代的3,6-二氢-2H-吡喃的合成主要依赖于官能团转化,因此,通过结构核心多样化策略直接操纵具有大量易于获得的α-取代的
两相流动现象广泛存在于工业生产过程和相关科学研究中,其涉及到的过程参数众多,且流动状态十分复杂。准确识别两相流流型有助于揭示其流动机理进而提升参数测量的准确性。传