基于QR分解的稀疏LSSVM算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:pgq1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(SVM)是一种有效的数据挖掘算法,被广泛用于分类和预测问题。但是训练样本规模较大时,支持向量机求解凸二次规划问题的计算复杂度比较高,甚至难以求解。最小二乘支持向量机(LSSVM)将凸二次规划问题转化为线性方程组求解问题,大大提高了计算效率。但是它的解缺乏稀疏性,难以有效解决大规模训练问题。尤其在数据量较大时,大规模训练数据形成的核矩阵在训练过程中往往难以存储,甚至无法参与计算。由于提高稀疏性成为最小二乘支持向量机的迫切需求,因此稀疏最小二乘支持向量机应运而生。而稀疏最小二乘支持向量机算法的关键是寻找尽可能最优的小规模低秩近似核矩阵代替核矩阵进行求解,从而提高解的稀疏性并降低计算复杂度。本文从两个方面讨论稀疏求解算法。  一方面,传统稀疏最小二乘支持向量机算法一般通过随机选择部分样本来得到核矩阵的小规模低秩近似矩阵。为了使小规模低秩近似矩阵来尽可能很好地近似原来的核矩阵,利用QR分解的数值稳定性保证所选样本之间保持较大的差异。本文利用QR分解的这一优势,迭代地选择核矩阵的部分列,来得到核矩阵的Nystrom近似,并据此得到P-LSSVM的稀疏解,从而提出基于QR分解的QRP-LSSVM稀疏算法。本文通过理论分析和实验表明,QRP-LSSVM算法可以得到更加稀疏的解,甚至在稀疏水平不超过0.05%的情况下也能达到较高的准确率。本文提出的QRP-LSSVM算法稳定性好,可以有效解决大规模训练问题。  另一方面,本文将基于QR分解选择差异性较大样本的优势运用到约减支持向量机(RSVM)中。我们采用基于QR分解选择样本子集的方法尽可能地筛选有代表性的样本来得到约减支持向量集,来弥补了RSVM随机选择约减集所导致的一系列不足。本文在基于QR分解选取约减集的基础上,分别讨论了采用不同损失函数的情况下,约减支持向量机的求解算法。并且分别得到基于Square Hinge损失函数、最小二乘损失函数和Huber损失函数的QRP+SHRSVM、QRP+LSRSVM和QRP+HRSVM算法。本文通过理论分析和实验表明,基于Square Hinge损失函数的QRP+SHRSVM算法过程中牛顿迭代简单,且可以得到比较高的测试准确率。另外,通过与随机选择约减集的RR+SHRSVM算法对比,突出了QRP+SHRSVM算法筛选出有代表性的样本来得到支持向量集的优点,提高了算法稀疏性和结果的稳定性。
其他文献
多普勒雷达资料具有很高的时空分辨率,能观测到中小尺度对流单体的三维结构,因而雷达资料同化对改善初始场中小尺度信息的质量、提高短时和临近数值天气预报水平具有巨大的潜
经典的车间调度问题主要包含:流水线车间调度、任务车间调度和开放式车间调度,其中开放式车间调度又分为允许抢先和不允许抢先。这些调度问题均属于NP-hard问题,且每个调度模型均在企业生产中有很多应用。因此研究车间调度问题意义重大。而允许抢先的开放式车间调度问题又是最复杂的调度问题,因此本文以此为着手点,提出解决问题的方法。本文从车间调度问题的背景和研究现状入手,给出了三类车间调度问题的一般化模型。对
本文主要讨论了可数无穷迭代函数系的分离性质.首先,我们讨论了非空紧子集上的共形迭代函数系的一些性质;其次,我们研究了两类特殊的自相似无穷迭代函数系.其中一类中的吸引子
本文利用Banach不动点定理证明非线性发展方程的初边值问题:的解的存在性,Ω(∈)RN(N>4)是一个有界光滑的区域,T>0是固定的,其中g∈H1(Ω),f:Ω×R×RN→R,满足一些结构性条件:  
本文研究如下抛物型偏微分方程的最优控制问题。(数学公式略)   在传统的有限元方法求解中,最优性条件中的三个方程时空耦合,将遇到庞大的计算量。为此,我们研究区域分解算法.
本文主要在三维空间中研究了流体动力学模型中的一些问题.   首先我们研究了非等熵的Euler-Poisson,方程的平衡解问题.假设宏观熵S为:S(x)=θln|x|,其中θ是一个常数.则通
视线跟踪技术是通过采集实时眼动信息,建立人眼和目标区域之间的关系,有着广泛的应用。视线跟踪技术中数学模型较为复杂,如三维角膜曲率中心和二维瞳孔中心模型都是非线性数
学位
本文主要研究了环形区域上Helmholtz方程的第三类混合边值问题,即寻找函数u∈C2(D1\-D2)∩C(-D1\D2),使其满足如下问题:其中κ为正的波数,λ1,λ2(λl<0,λ2>0)为边界阻抗系数.D1,D2是Rs(