基于多核学习的单类支持向量机

来源 :河北大学 | 被引量 : 0次 | 上传用户:lwz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的单类支持向量机(one-class support vector machine,OCSVM)在非监督学习领域中取得了较优的性能,从而得到了越来越多的关注。然而,OCSVM存在以下不足之处:一、OCSVM的分类性能在很大程度上依赖于核函数及其参数的选取,若选取不当,则OCSVM就会取得较差的分类效果,而对OCSVM的核函数及其参数的选取迄今仍无可靠的理论依据;二、OCSVM对训练集中的噪声非常敏感,若训练集中含有的噪声较多,则OCSVM的性能会受到严重影响;三、对于混合数据,如医疗诊断中的患者信息既有血型、血压等离散和连续的数值信息,也有CT、彩超等图像信息,OCSVM根本无法处理。针对上述问题,可以将多核学习(multiple kernel learning,MKL)引入到OCSVM中。MKL方法在分类及回归任务中均取得了优于单核学习方法的性能。为了解决OCSVM的上述问题同时提高其分类性能,本文提出了两种新型的多核OCSVM。1.提出了基于中心核对齐的多核单类支持向量机。首先利用中心核对齐(centered kernel alignment,CKA)计算每个核矩阵的权重,然后将所得权重用作线性组合系数,进而将不同类型的核函数加以线性组合构造组合核函数,最后将组合核函数引入到OCSVM的对偶优化问题中代替单个核函数。所提方法既能避免核函数的选取问题,又能提高泛化性能和抗噪声能力。在20个基准数据集上与其他五种相关方法进行了实验比较,验证了所提方法的有效性。2.提出了深度多核单类支持向量机,利用深度多核学习(deep multiple kernel learning,DMKL)对核函数进行组合,即通过多个核函数的多次特征映射得到组合核矩阵,然后使用梯度下降法求取最优的组合权重,进而获得最优的组合核函数,最后也是将组合核函数引入到OCSVM的对偶优化问题中代替单个核函数。所提方法不仅可以避免核函数及其参数的选取问题,还提高了模型的泛化能力。在基准数据集上的实验结果可以发现,所提方法取得了优于其他五种相关方法的分类性能。
其他文献
近年来,我国网络文学领域发展迅速,并逐渐成为出版、影视、游戏等多行业领域全版权运营的内容源头,发挥着其时代性、现象级的核心动能作用。但网络文学作品数量的快速增加给读者选择作品和平台的管理都带来了困扰,部分网络文学平台存在缺少重要描述性信息和评价性信息,以及重要作品信息未被设置为检索点等问题。鉴于用户的筛选困难和平台的管理问题,对网络文学作品信息进行规范化管理具有重要的意义。网络文学作品元数据在平台
本文主要考察现代汉语中“否+A+否+B”格式,包括“无A无B”“不A不B”“非A非B”“没A没B”四个格式。本文对四个格式内部的语法关系、语义关系和表量类型进行了细致分析,并通过比较得出四个格式的相同点和不同点。本文共分为三部分:第一部分为绪论,介绍了本文的研究对象、研究内容和研究意义,梳理前人研究的重要成果,并阐述本文的研究方法和语料来源等情况。第二部分为正文,包括第二到六章,介绍了“无A无B”
《甲库善本》全称《原国立北平图书馆甲库善本》,其收录的古籍为原清内阁大库藏书,总数量达到了三千余种。《甲库善本》收录的这一批古籍的版本主要以元明刻本为主,同时兼有部分宋刻本、清刻本以及抄本,版本丰富,数量众多。在目前宋刻本流传已经十分稀少,元明刻本流传也逐渐稀少的情况之下,《甲库善本》所收录众多古籍的版本价值便值得进行深入地探讨与研究,因此本文的主要内容就是利用文献学的基本方法,以客观事实为依据,
数字经济为“数字丝绸之路”国家经济发展提供新动能,中国数字经济在“一带一路”沿线国家中的总量上有明显的优势,却不能意味着较高的数字经济效率。当我国的数字经济效率具有较大优势时,将数字经济发展经验及数字经济成果共享,创造新价值,为实现“一带一路”的互联互通合作共赢提供力量。对数字经济效率进行测算,以新的视角研究“一带一路”沿线国家数字经济的发展势在必行。本文运用三阶段超效率SBM模型,引入外部环境变
党中央、国务院历来高度重视安全生产工作,习近平总书记多次发表重要讲话,指出安全生产是企业必须做到的一件事情,是企业发展的边界线,即企业不能通过牺牲人的生命,付出这样的代价达到发展的目的。但近些年来,经常发生重大的安全生产事故,引发大量人员伤亡和大量财产损失的不良影响,带来了极其恶劣的社会影响。经统计数据得出结论:大部分的生产安全事故的原因是企业违法违规进行生产经营,其中又有很大一部分原因是安全生产
简帛书是先秦至魏晋时期古人以简牍和缣帛为载体所书写的墨迹。简帛书法自19世纪末一经发现就备受学界关注,而简帛书法资料的日渐丰富又进一步推动了人们对简帛书法的认识。简帛隶书是最真实的隶书真迹,是碑刻铭文书法无法代替的古人墨迹,因此简帛书法对当代隶书创作和研究是不可或缺的重要内容。简帛书法对当代隶书创作产生了重要的影响,但目前对这方面的研究并不充分。本文首先对秦汉时期简帛的使用情况和当下的简帛实物的发
自改革开放以来,我国经济发展进入新时代,正大步向高质量发展的新阶段迈进。2013年5月初,中共河北省委第八届五次全会提出只有实现“无中生有”的目标来发展战略性新兴产业,提高“有中生新”的速度来优化传统产业,才能符合新阶段的任务与要求,实现河北省经济的高质量发展。因此,对河北省战略性新兴产业与传统产业进行评价指标体系的构造,深入探讨两类产业间的协调发展状况及影响因素,不仅能够为正确处理好两类产业的关
本文旨在调查阅读推广活动中的读者从众行为特点,厘清读者从众行为对活动参与意愿的影响效果,为公共图书馆阅读推广活动设计、宣传提供参考。研究基于从众理论和阅读推广活动实践案例推演得出读者从众行为模型,以多个省份、城市公共图书馆为样本基地,在馆长和馆员的帮助下,对参加阅读推广活动的读者开展线上和线下问卷调查。问卷以读者从众行为模型为框架,共包括社会人口学资料统计和从众行为调查两部分。应用SPSS21.0
在当今计算机网络时代,微博、淘宝、京东等应用平台给人们的生活带来了很大的便利,与此同时,大量的评论与观点由此而生。用户的评论与观点代表着用户的情感倾向。掌握用户的情感倾向,就可以有效地为用户推荐或规避某些话题或者商品。如何从这些内容中把重要的情感信息挖掘出来显得尤为重要。本文针对文本的情感分析任务,提出了一种情感分析残差网络模型,该模型充分利用了相似文本之间的特征关联性,在情感分析任务上取得了良好
伴随着系统仿真和控制芯片性能的日趋发展,对于现在的控制需求来说仅仅依靠纯数学仿真显得力不从心。由此而来的半实物仿真技术逐渐得到了普及,因它兼具纯数学仿真和物理试验的特性,所以在工业界得到了广泛的应用。本文通过对半实物仿真技术进行分析与研究,结合学校中的实际情况,在保证性能的前提下,控制设计成本,搭建了基于STM32与MATLAB/Simulink的半实物仿真平台,满足了教学与科研中的需求。为了验证