稳健支持向量机回归算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户：zhangruidao10

【摘要】

：

支持向量机(SVM)回归算法因其良好的小样本学习能力,方便简洁的非线性处理能力,以及收敛过程无局部最小等优点赢得了学术界的广泛关注。它以最小化结构风险为目标,以求解二次

【作者】

：

温雯

【机构】

：

华南理工大学

【出处】

：

华南理工大学

【发表日期】

：

2008年期

【关键词】

：

支持向量机支持向量机回归算法回归算法小样本学习小样本学习非线性处理非线性处理损失函数损失函数

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

支持向量机(SVM)回归算法因其良好的小样本学习能力,方便简洁的非线性处理能力,以及收敛过程无局部最小等优点赢得了学术界的广泛关注。它以最小化结构风险为目标,以求解二次规划问题为途径,有效获取样本集中的统计信息。然而由于损失函数的限制,多数SVM回归算法并不具备完善的稳健性,即容易受到异常样本的影响而产生有偏的学习结果。因此,本论文着眼于噪声环境下的SVM回归算法,在降低噪声数据对SVM回归算法的负面影响以及提高SVM回归算法的自身稳健性两个方面进行了深入的研究,获得了一些有意义的成果。具体而言：首先,从数据“预处理”的角度设计良好的算法减少噪声数据对SVM回归算法的负面影响。针对包含噪声的大规模样本集,本论文采用分层聚类的方法对训练样本进行预处理。利用聚类后所获得的类密度信息,区分异常样本类和正常样本类；并将聚类过程分解到各层子集合中进行,以减少算法的复杂度,提高预处理的速度。对于这种分层聚类的数据预处理方法,本论文通过基准仿真数据集上的测试说明了其有效性及快速性。其次,对于异常样本比例较小的数据集,着重研究了异常样本“软剔除”的方法,即加权的方法。由于传统的加权SVM回归算法(以Suykens等人的WLS-SVM算法为代表),是基于回归训练本身的结果对样本进行区分,这在学习结果已有偏差的情况下将导致错误的权重设置；此外,传统的加权SVM回归算法还要求重新训练SVM回归机,这将造成运算量的急剧增加。为解决这两个问题,本论文分别基于核距离信息以及样本异常程度信息为WLS-SVM回归算法设计了两种新的加权方法,并且采用数值方法找到了LS-SVM学习矩阵与WLS-SVM学习矩阵之间的关系,从而据此设计了一种快速算法大幅度减少WLS-SVM回归机的运算复杂度。论文中通过多个仿真数据集和实际数据集上的测试说明了所提出算法的有效性及快速性。再次,由于加权的方式毕竟是一种过于温和的方式,随着样本集中异常样本比例逐渐增大时,异常样本“软剔除”的方案对SVM回归算法稳健性的改善效果逐渐减弱,甚至于完全失效。因此对异常样本比例较大的数据集,需要使用“直接剔除”的方法来消除异常样本的影响。本论文就此提出了两种基于异常样本“直接剔除”的稳健LS-SVM回归算法。这两种算法创新性地采用“学习->剔除->再学习”的循环方式对异常样本进行逐步剔除,以达到消除异常样本影响,纠正训练结果,提高算法稳健性的效果。两种算法中分别采用了不同的异常样本检测策略,从而适用于不同的噪声分布情况。本论文提供了详尽的数据实验来说明这两种算法的应用价值,为设计稳健SVM回归算法提供了一种新的思路。最后,以实时视频监控中的背景/前景分割问题为切入点,将视频流视为时间序列,采用稳健的LS-SVM回归算法对动态背景进行自适应学习,从而为前景的区分提供有效的参考信息。本论文总结了这一应用尝试中颇具参考意义的实验结果,阐明了稳健LS-SVM回归潜在的应用前景,同时也从另一个方面说明了稳健LS-SVM回归算法优良的学习能力。

其他文献

综合业务接入网关多媒体会议能力开放组件的设计与实现

随着网络技术的迅猛发展以及三网融合的不断推进,多媒体会议系统逐渐成为高品质高带宽的热门应用。然而,传统的基于H.323协议栈的多媒体会议系统已经无法满足用户日益丰富的

学位

业务能力开放多媒体会议综合业务接入网关CIN-SCF

基于以太网的雷达实时控制系统架构研究与实现

传统的雷达设计都采用自下而上的方法并使用特有的硬件及软件架构。在这种开发模式下每一个雷达系统都采用独有的架构和开发技术，因此通常耗费大量的时间金钱，并且使得系统的维

学位

以太网雷达实时控制开放系统COTS体系架构智能控制器自适应控制

基于LDAP协议的异构数据源集成与信息共享关键技术研究

随着信息技术的发展，高校各部门之间信息交互日趋频繁，然而由于各部门应用系统之间的体系结构、操作系统平台和数据库平台之间差异，造成系统间难于、甚至无法进行信息交互，从而形

学位

数据集成XML目录服务LDAP

文本蕴含识别研究

伴随着大数据(Big Data)时代的到来,数据增长的速度越来越快。由于这些数据中充斥着大量无用、冗余的信息,并且自然语言存在着固有的表述多样性,这使得计算机“理解”文本的

学位

文本蕴含识别多特征知识抽取机器学习规则

保持形状特征的三维网格模型多分辨率表示重构

随着三维数据获取和相关处理技术的迅速发展,密集的三角网格表示已成为计算机图形学事实上的标准.为了表示模型的丰富细节,网格数据常常规模庞大,直接对其存储、传输、绘制、

学位

三角网格三角网格计算机图形学计算机图形学拓扑拓扑重构网格重构网格

基于SOA的即时消息互联互通平台的研究与实现

伴随着互联网的高速发展,各种IM(Instant Messaging,即时消息)不断涌现,凭着其实时交互的特点迅速在网络通信领域中占据一席之地。经过二十几年的发展,IM已经超越电子邮件,成

学位

即时消息即时消息面向服务架构面向服务架构Web服务Web服务Jabber服务器Jabber服务器XMPP协议XMPP协议

基于SCA/SDO的构件在电力信息系统中的研究与应用

SOA(面向服务架构)越来越受到人们的关注,特别是Web Services的出现,使SOA走向了实际应用。如何实施SOA是当今的一个热点,与美国很高的企业信息化程度相比,在中国,大量的服务

学位

电力信息系统电力信息系统企业信息化企业信息化电力企业电力企业

数字图像处理的算法研究

图像文件不仅占据内存空间，而且也占据大量的传输带宽，这使得许多信息行业必须通过使用图像压缩技术，才能解决因为图像数据量大而带来的存储和传输问题。过去的三十年里，JPEG

学位

图像文件图像数据图像压缩编码算法

语义Web服务组合形式化描述及验证研究

传统的Web服务技术缺乏机器可理解的语义，限制了Web服务的自动化，语义Web研究的兴起为Web服务技术带来了新的活力，这两种技术的结合产生了另一个新兴的研究课题一语义Web服务，语

学位

语义Web服务服务组合状态演算意愿公理表示次序构词

基于.NET框架核心服务的研究与应用

随着计算机网络技术的高速发展，使得网络教学获得了前所未有的强大技术支持手段。远程教学技术是目前计算机网络应用的一个研究热点。论文在对远程教育与教学管理平台现状充分

学位

网络教学核心服务远程教育教学管理管理模式

稳健支持向量机回归算法研究

与本文相关的学术论文