基于多核学习的高性能核分类方法研究

被引量 : 0次 | 上传用户:blueteen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类器设计是模式识别的主要研究方向之一。一个有效的分类器设计方法可以使识别过程事半功倍。核方法是一种有效的分类方法。但是,传统的核方法是基于单个核的,而单个核函数无法有效描述模式的特征,这就引出了基于多个核的高性能核分类方法研究。多核分类器学习方法期望通过融合多个核函数来尽可能详尽地描述模式的多种特征,在处理多源异构数据集时显得既稳定又灵活。由于在融合多个核函数的过程中存在大量的计算,现有的多核分类器学习算法存在计算复杂度高和占用内存空间大等问题。本文将Nystrom逼近和随机投影的思想应用于多核分类器学习算法之中,力图在保证分类正确率不变差的前提下降低空间和时间复杂度,设计出高性能的多核学习算法。本文的主要工作如下:(1)提出了一种新的融合多个核矩阵的多核学习算法。该算法从整体样本集中随机选取一部分样本,然后使用Nystrom逼近算法求出原始核矩阵的近似矩阵,根据每个核矩阵的近似误差确定多个核矩阵的组合系数,最终将这些近似核矩阵组合起来。Nystrom逼近算法一方面降低了核矩阵的计算复杂度,另一方面也给出了一种直观的多个核矩阵组合方法。我们将这种算法及其多核分类器应用于人造数据和机器学习数据库的判别分析之中,取得了较为理想的实验效果。(2)提出了一种基于随机投影的显式核映射多核学习算法。随机投影可以在降低样本维数的同时保持不同类别在特征空间的近似可分性。正是利用这一特性,我们将随机投影理论与现有的多核学习算法MutliK-MHKS相结合,在构造核矩阵的过程中,利用随机选择的部分样本集构造显式核映射。由于随机投影后的样本维数降低,计算复杂度也随之下降,同时随机投影的近似可分性保证了多核分类器的分类正确率依然得到明显提高。本文提出的两种多核分类器学习算法在一定程度上缓解了分类正确率与计算复杂度之间的矛盾。与传统的多核分类器学习算法相比,所设计的分类器在降低时间和空间复杂度的同时依然保持了较高的分类正确率。理论分析和仿真实验都证明了本文所设计的多核分类器学习算法的优越性。
其他文献
思想政治理论课(以下简称“思政课”)是对学生进行思想政治教育的主渠道。为有效提高思想政治理论课教育教学的针对性、实效性、吸引力和感染力,针对思想政治理论课教学改革的必
针对加油站防渗改造工期紧、任务量大以及改造质量难以把控等问题,提出分三个阶段,从细节入手,严格控制施工质量。在施工前期要做好方案设计和厘清参与各方责任;在施工阶段,
信息素质已经作为素质教育的一个有机组成部分。通过对受教育者的信息素质进行培养,有利于促进其更为全面的发展,是人才培养的,z-4~条件之一。通过培养信息意识、提高信息获取
<正>HVLA(High Velocity,Low Amplitude)脊柱手法是手法治疗师使用特定幅度、特定方向和特定时间的力,作用于脊柱的靶向部位上进行的一种力学干预,其特征是高速度、低幅度[1]
两世界的划分,作为西方哲学本体论问题研究的典型范例,受到了历史上很多哲学家的关注,通过对研究者中最具代表性的哲学家柏拉图和康德两人所提出的两世界理论进行简要阐述和
<正>每个人都是一座孤岛,网络将疏离感连接一个在现实世界中孤独语塞的人,微信朋友圈竟然有1000多位好友。那1000多人是否构成了我们的世界?是,也不是。我真正认识、在生命的
期刊
<正>在大家都热衷谈论"互联网+"的当下,有人这样通俗形容,传统集市+互联网有了淘宝,传统百货卖场+互联网有了京东,传统银行+互联网有了支付宝,传统的红娘+互联网有了世纪佳缘
卫生信息网络直报系统是基于J2EE的直报系统利用XML技术对上报的卫生信息数据进行传输,采用MVC设计模式实现了B/S模式下网络直报功能。
<正>2015年新年伊始的第一个工作日,李克强总理来到深圳,一句话"创客充分展示了大众创业,万众创新的活力",引发了深圳的风云突变,预示着创客时代的到来。仅隔3周之后的1月28
期刊
<正>近期,参考消息网登出了一则发人深思的新闻,题目为《日媒:近六成中国农民承认农产品"一家两制"》。文中所述的"农产品‘一家两制’",是指农户对于供自己食用的农产品和所