半监督稀疏拉普拉斯支持向量机研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户：sql70

【摘要】

：

支持向量机(Support Vector Machine,SVM)是基于统计学理论的一种通用有监督机器学习算法。支持向量机实现了结构风险最小化原则,具有高拟合度、参数较少、推广能力强以及全

【作者】

：

徐志强

【出处】

：

苏州大学

【发表日期】

：

2019年01期

【关键词】

：

稀疏学习半监督学习支持向量机图正则核函数

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

支持向量机(Support Vector Machine,SVM)是基于统计学理论的一种通用有监督机器学习算法。支持向量机实现了结构风险最小化原则,具有高拟合度、参数较少、推广能力强以及全局最优等优点。支持向量机作为解决小样本非线性问题的有效工具之一,一直以来都备受研究人员的关注。然而,实际获得的数据往往是无标签的。由于其易于获取,因而数量庞大。给所有的数据都打上标签是一件费时又费力的事。如何能有效地利用少量有标签样本和大量无标签样本,是半监督学习要考虑的问题。拉普拉斯支持向量机(Laplacian SVM,LapSVM)把拉普拉斯正则引入到支持向量机中,成功将支持向量机从有监督学习领域延伸至半监督学习领域,实现了支持向量机对无标签数据的利用。真实数据包含着各种噪声,例如冗余特征或样本等,这些噪声将对模型性能产生负面影响。为了消除噪音或冗余的影响,生成一个稀疏决策模型来实现数据约减则显得尤为必要。为了解决拉普拉斯支持向量机不具有稀疏决策模型的问题,本文对稀疏拉普拉斯支持向量机进行了研究,并应用到分类、降维和去噪等典型半监督学习任务中。论文的主要研究工作和创新点如下:(1)基于拉普拉斯支持向量机,本文引入L1范数正则,提出一种半监督的稀疏支持向量机算法—L1范数拉普拉斯支持向量机(L1-norm Laplacian Support Vector Machine,L1-norm LapSVM)。与拉普拉斯支持向量机不同,L1范数拉普拉斯支持向量机的求解是在原空间中进行的。此外,目标函数中Hinge损失函数和L1范数正则同时保证了解的稀疏性。该方法可以同时实现特征约减与样本分类。也就是说,该方法既可以被视作是一种分类器,也可被认为是一种特征选择方法。实验证明了在对比的线性方法中,L1范数LapSVM具有较好的性能。(2)为处理非线性数据,通过引入高斯核来拓展线性半监督稀疏拉普拉斯支持向量机算法,提出了核L1范数拉普拉斯支持向量机(Kernel L1-norm Laplacian Support Vector Machine,Kernel L1-norm LapSVM)。核L1范数拉普拉斯支持向量机的目标函数中也包含了 Hinge损失函数和L1范数正则,因此模型的稀疏性也得到了保证。该方法可以同时实现样本约减与样本分类。实验证明了在对比的非线性方法中,核L1范数拉普拉斯支持向量机具有较好的分类性能。(3)提出了一种半监督的流形保持图约减算法,利用该算法可以对数据进行预处理。当样本数量比较大时,核L1范数拉普拉斯支持向量机有很高的计算复杂度。为了解决这个问题,我们提出了 SMPGR以及它的核版本进行数据预处理以提高样本质量。进行预处理后,既可以将样本规模缩小,又能保持住数据的原始结构信息。把该预处理方法和半监督稀疏拉普拉斯支持向量机相结合,进一步实现了样本数据的约减,实验也验证了其在半监督学习中的有效性。

其他文献

基于加权双重机制的强化学习方法研究

在强化学习中,智能体与环境交互并从环境给出的评价式反馈中进行学习。该学习过程十分类似于人类自身在学习新事物时的学习方式,因此强化学习也被认为是迈向通用人工智能的重

学位

加权双重机制强化学习深度强化学习经验重放机制值迭代网络

青霉素G酰化酶的固定化及其在制备(S)-邻氯苯甘氨酸中的应用

(S)-邻氯苯甘氨酸是一种具有广泛用途的医药中间体,其主要用途之一就是合成新型安全高效的抗血小板凝聚药氯比格雷。氯比格雷是法国Sanofi公司于1986年开发,目前是全球热销的

学位

(S)-邻氯苯甘氨酸青霉素G酰化酶多点共价固定填充床反应器

经销商再制造闭环供应链政府补贴策略研究

为了提高资源的利用效率、减少环境污染,再制造已成为政府、企业和学术界共同关注的问题。而在设计阶段就考虑产品可再制造性能大大提高再制造效率。本文以经销商再制造模式

学位

经销商再制造闭环供应链政府补贴Stackelberg博弈

苏州市新生代农民工的职业流动及其对工资收入的研究

随着新生代农民工队伍的壮大,其“高流动”和“水平化”的职业流动特点备受社会关注,是什么因素影响了新生代农民工的职业流动,通过职业流动是否真的能实现收入的增长?基于这

学位

新生代农民工职业流动工资收入

中国广翅蜡蝉科分类及比较形态学研究

广翅蜡蝉科Ricaniidae隶属于半翅目Hemiptera头喙亚目Auchenorrhyncha蜡蝉总科Fulgoroidea。全世界共有68属440余种,中国分布8属46种(包含本文2新属、1新记录属、12新种)。广

学位

蜡蝉总科广翅蜡蝉科分类比较形态学系统发育

借助于橘子皮制备多功能的Fe3O4和合金Cox/Nix-Fe1-x@C（x=0～1）纳米结构材料

电解水是一种能够制备高纯度氢气的技术。电解水有两个半反应,分别为析氧反应（OER）和析氢反应（HER）。目前,性能优异的电催化剂为Pt,RuO2,IrO2等贵金属催化剂。然而因其资源匮乏,

学位

Fe3O4Fe@C合金电催化性能磁性能吸附性能

南方根结线虫生防真菌的筛选及其代谢活性物质研究

以南方根结线虫为靶标,从青海土壤样品中筛选具有杀线虫活性的生防真菌;通过传统分类和分子系统学等方法对所筛选的真菌菌株进行分类鉴定;利用萃取、层析等方法,分离纯化真菌

学位

南方根结线虫生防真菌代谢活性物质分离纯化毒力测定

基于经验的安全深度强化学习研究

深度强化学习结合了强化学习和深度学习的优势,在决策类感知任务中已取得了较大进展。然而,深度强化学习的训练离不开智能体与环境的大量“试错”训练,该方式没有考虑到安全

学位

强化学习深度强化学习安全深度强化学习经验重放连续空间

控制权与民营上市公司债券违约研究

企业信用风险问题一直受到学术界和实务界的广泛关注。随着我国经济的发展,债券融资等直接融资的规模也在不断扩大。但是18年以来,由于受到宏观经济形势与“去杠杆”等政策影

学位

控制权债券违约控制权私利过度自信

金融知识、正规信贷可得性与农户创业选择

在当前我国经济新常态的背景下,农户创业对于推动新农村建设目标的实现,促进农户收入的可持续增长具有毋庸置疑的重要性。中央下发的一系列有关创业政策文件都提出应强化创业

学位

农户创业选择金融知识正规信贷可得中介效应检验

半监督稀疏拉普拉斯支持向量机研究

其他学术论文