鲁棒最小二乘支持向量机研究与应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:CHENHUANHUAN7
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
二分类问题是统计学习理论、机器学习以及人工智能中研究的一个重要问题。支持向量机模型采用结构风险极小化原则和核函数方法来构造分类模型,模型比较简单,解具有唯一性。最小二乘支持向量机模型使用误差均方和作为目标函数,把二次规划模型的求解转化成求解线性方程组,克服了支持向量机模型求解二次规划计算量大的问题。但是最小二乘支持向量机模型中的等式约束以及目标函数中的均方误差和使得模型的解丢失了稀疏性,降低了解的鲁棒性。由于随机的或者非随机过程的存在,现实生活中的数据经常带有噪声和不确定性。数据的噪声以及不确定性会影响统计学习分类算法模型的性能,降低分类的准确率及其分类模型的推广能力。支持向量机和最小二乘支持向量机模型都是采用了固定范数的目标函数,这种建立模型的方法不能够很好的适应各种各样的数据结构,从而使得模型的适应能力较弱。为了加强最小二乘支持向量机模型的鲁棒性和稀疏性,增强其推广能力,使模型能够根据数据结构自动进行调整,本文主要开展了以下几个方面的工作:1.系统整理了文献中对支持向量机模型(SVM)和最小二乘支持向量机模型(LS-SVM)中改进鲁棒性的方法,并指出这些改进模型存在的问题和缺陷。从而得到了本文将要研究的主要问题,即以加强最小二乘支持向量机模型的稀疏性、鲁棒性和可解释性为目的,对原有模型进行了较大的改进,给出了基于最小二乘支持向量机模型的有效二分类算法模型。2.针对最小二乘支持向量机模型丢失稀疏性和鲁棒性的原因,提出了使用核主成分法对样本数据中存在的噪声特征进行剔除,并借鉴先前的增强最小二乘支持向量机模型稀疏性的方法,对特征进行压缩,给出了一个双层L1范数最小二乘支持向量机模型—KPCA一L1-LS-SVM.通过使用KPCA方法,可以有效的进行特征抽取和提取。同时以L1范数作为目标函数,可以有效的消除噪声点对模型推广能力的影响,并使模型的解更稀疏,从而可以降低计算的复杂度。在仿真数据集和基准数据库上对该模型的测试表明该方法是有效的。3.在实际的二分类问题中,由于噪声点或者噪声特征的存在使得样本的标签会出现不确定的情况。分类模型应该能够自动判别哪些是相对重要的点,哪些是受噪声点影响较大的样本,从而在分类函数的构造中剔除这种样本。模糊隶属度的概念则可以用来描述样本标签的不确定性。本文采用L1范数作为目标函数以及模糊隶属度的概念可以构造出一个具有稀疏性和鲁棒性的基于最小二乘支持向量机的分类模型—模糊L1-LS-SVM.在测试数据集上的测试表明这个模型同样可以消除噪声点的影响,并具有较好的可解释性。4.在分类问题中,不同的样本在分类函数的构造中所起的作用是不同的。在分类函数的构造中,样本所包含的判别信息越是重要,相应的样本对分类模型的构造所起的作用就越大。因此,为了区别不同样本对于决策函数构造的不同作用,可以对包含重要信息的样本赋予较大的权重,而包含次要信息的样本所对应的权重就会较小。通过这种赋权的方法也可以消除噪声点对分类模型的影响,使得模型具有鲁棒的特征。无论是支持向量机还是最小二乘支持向量机模型,在目标函数中都使用固定的Lp范数,这是一种基于先验知识的建模方法,不能适应各种各样复杂的数据结构。从模型更好的适应数据的角度出发,本文提出了一个赋权鲁棒最小二乘支持向量机模型—RW-Lp-LS-SVM.在仿真数据集以及UCI基准数据库上的测试表明该模型具有鲁棒性特征,稀疏性好,具有较好的解释能力。5.信用评估数据库所包含的数据类型比较特殊,其类别比例极不均衡。为了检验本文所提出的三个模型的分类性能,我们使用这三个模型在三个信用数据库上进行测试,所得到的结果说明模型能够较好的适应信用数据库类别不均衡的特点,因而可以作为信用风险评价的备选模型。
其他文献
近二三十年,医学的发展可谓突飞猛进,日新月异。随着医院管理领域发生的深刻变化,医院文化建设引起了越来越多的医院管理理论研究者和医院管理实践工作者的兴趣,越来越多的医
摘 要:学前教育是国民教育体系的重要组成部分,是重要的民生工程和社会公益事业。改革开放以来,我国学前教育事业取得了较大发展,但整体来讲学前教育在国家教育体系中还是比较薄弱的环节,尤其是学前教育发展不均衡,城乡之间、区域之间、校际之间发展差异较大。要促进学前教育均衡发展,就必须建立规范的办园制度、监管评价制度、法律保障制度,完善经费投入保障机制,形成政府主導、社会参与、公办民办并举的办园机,形成覆盖
企业并购最终失败的主要原因,企业战略目标不当的38%。组织运作问题28%.人力资源问题25%.资本运作问题9%。
<正>一、构建"和谐审计"的重要性(一)有助于更新审计理念构建和谐审计,应将人性化的审计理念贯穿到每个审计环节,做到法治和德治并重,充分体现审计者的人文关怀。坚持以法律
对于中国公众,印尼一直是一团迷雾。一个在东西方之间,在东方的印度、中华影响之间,在伊斯兰与非伊斯兰之间,在现代与非现代之间,在全球化与本土化之间的印尼,纠集在庞杂的历史与现
目的探讨妊娠合并子宫肌瘤行剖宫产术中切除的临床安全性及可行性。方法选择76例妊娠合并子宫肌瘤患者,根据患者及其家属的意愿,将其分为2组,即行剖宫产术同时切除子宫肌瘤组
目的:用整体性思路的代谢组学技术与中医的整体观念进行有效组合,加快中医药学研究的现代化进程。方法:概述代谢组学的基本概念和常用的分析技术,从代谢组学与中医辨证论治、中
纪录片作为一种电视艺术形式,同时也是地域文化传播的优秀载体。中国由于地理位置的不同形成了很多地域文化,如"齐鲁文化""吴越文化""秦文化"等等,由此也产生了因地域文化不同而风
阐述了板栗的优质高产栽培方法,探讨了高要求建园、培育优质树冠、合理施肥加水管理、病虫害系统防治、收获及保存等高产栽培技术,以期为板栗栽培高质高产提供必要的参考依据
十几年前,我还是个梳着两条小辫子的纯情少女,带着梦想来到了美国。我有过语言上的障碍,有过经济上的窘迫,但所有的困难都不及晚上没有能安然归属一个家的那种孤独。这几十年
期刊