面向噪声分类的非平行支持向量机模型研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:winxb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从支持向量机到非平行支持向量机的研究,近几年引起广泛关注。支持向量机主要是寻找一对平行超平面,并且使这两个平行超平面的间隔尽可能的大。而非平行支持向量机旨在为每类数据构造一个最优的超平面,构造的超平面并没有平行这个限定,并且期望每个超平面能够靠近本类数据,而远离其他类数据。非平行支持向量机解决了传统支持向量机面临的两个问题,一个是解不等式二次规划需要的高计算复杂度,另一个就是求解异或问题,而且非平行支持向量机对不同类型的数据有较好的分类能力。在一些具有噪声的数据中,噪声会降低决策函数的泛化能力,容易引起过拟合,影响其分类性能。非平行支持向量机主要考虑从损失函数和数据结构出发,提高其分类性能。因此,本文在非平行支持向量机的基础上提出了不同模型的非平行支持向量机模型。本文主要分为以下两个主要研究内容:一方面,从支持向量机的角度出发,利用不同的损失函数构造出不同的非平行支持向量机模型。该模型引入了新的软间隔损失函数,可以适用于不同类型的数据;这个新的非平行支持向量机可以退化为标准的支持向量机模型,这样该模型的计算方法和支持向量机的计算方法是一样的;把具有稀疏性的损失函数加入到非平行支持向量机中,既保持了稀疏特性,有可以适应不同类型的交叉数据。通过大量的公共数据集实验验证了其有效性。另一方面,两个优秀的非平行支持向量机模型:广义特征值近端支持向量机(Proximal Support Vector Machinevia Generalized Eigenvalues,GEPSVM)及其改进的广义特征值近端支持向量机(Improved Generalized Eigenvalue Proximal Support Vector Machine,IGEPSVM),它们具有良好的推广性能,但是,在实际应用中它们也有一些缺陷。首先,GEPSVM和IGEPSVM中得经验风险是用L2-范数计算的,L2-范数中使用的是平方距离,对噪声和异常值具有敏感性,降低了其分类性能。其实上述两种非平行支持向量机并没有考虑数据的相关结构,当数据高度相关时,其分类能力降低。为了缓解上述问题,本文提出了一种用于噪声分类的迹模正则化鲁棒近端支持向量机(Robust Nonparallel Proximal Support Vector Machine,RNPSVM),在IGEPSVM的基础上,把L2-范数改为L1-范数,L1-范数是用绝对值之和来衡量的,降低了对噪声的敏感性,旨在最大化L1-范数的类间距离的同时,最小化L1-范数的类内距离,使其对异常值具有鲁棒性;通过考虑数据的相关性,引入了迹模(基于训练数据的自适应模)惩罚项,这个迹模惩罚项不仅具有稀疏性,在数据相关度较高时其分类性能也是很好。在GEPSVMs中可能遇到奇异值问题,通过修改模型可以避免出现奇异值问题;最后提出了一种有效的迭代算法,并且验证了其收敛性。在合成和现实噪声数据集上的广泛实验结果验证了RNPSVM的有效性。
其他文献
学位
学位
构建于边缘计算之上的跨域大数据分析应用能够获得更广阔的计算域、更丰富的资源储备,以及更灵活的服务模式。然而,低时延——这一跨域大数据分析优化领域积极追求的重要指标
我国关于夫妻共同债务的立法规范长期处于动态调整,不断完善的过程之中,相关问题也是学界研究的焦点。本文撰稿期间公布的《民法典婚姻家庭编(草案)》1拟将2018年1月最高人民
随着GPS设备的普及,产生了越来越多的轨迹大数据,为提升综合交通运输服务水平,加快建设交通强国,利用大数据的处理方法对出租车的轨迹数据进行有效的处理分析和存储显得尤其
随着机器人技术的快速发展和人工智能的出现,机器人的应用逐渐拓展到许多领域,但同时也面临着操作环境复杂多变,操作对象种类复杂的问题,因此对机器人的适应性和灵活性提出了更高的要求。近年来,材料科学和可拉伸电子等领域的发展促进了软体机器人领域的快速发展。软体机器人由可承受大应变的超弹性材料制成,具有理论上的无限自由度和连续变形能力,有很强的适应性和高度的灵活性。本文在模拟人体手指的结构及功能的基础上,以
体系结构建模是软件设计的重要环节,目前国外已经研发出Magic Draw等系统建模软件。但国内缺少类似的体系结构建模软件,如果在军事等敏感领域使用国外的建模软件就会存在泄密
植被在陆地生态系统中扮演着重要角色并发挥重要的作用。气候变化、自然灾害以及社会经济因素均可能引起植被发生变化,因此开展植被变化及驱动机制研究具有重要意义。本文利
随着我国经济的快速发展,公民的财产总量在不断增长。同时,伴随着农村承包责任制的实行和房地产市场的蓬勃发展,公民拥有的不动产也在迅速增加,并成为私有财产中最重要和最具
最优输运理论是在概率测度空间中讨论的一类特殊的最优化理论。基于最优输运理论的很多技术和算法近年来受到了学术界和业界的广泛关注。鉴于它们能够为数据分布提供精确的生