多类别分类与流形学习问题的算法研究

来源 :中国科学院研究生院中国科学院大学 | 被引量 : 0次 | 上传用户：wind1120

【摘要】

：

本文针对多类别分类问题，提出了一种基于核主成分分析的投影残差分类器，首先通过与高斯核函数对应的非线性特征映射，将多个类别映射为特征空间中的特征子空间，非线性特征映射能够

【作者】

：

于传帅

【机构】

：

中国科学院大学

【出处】

：

中国科学院研究生院中国科学院大学

【发表日期】

：

2012年期

【关键词】

：

数据挖掘聚类分析流形学习高斯核函数

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文针对多类别分类问题，提出了一种基于核主成分分析的投影残差分类器，首先通过与高斯核函数对应的非线性特征映射，将多个类别映射为特征空间中的特征子空间，非线性特征映射能够降低特征子空间的维数，并增强它们之间的两两正交性，然后用核主成分分析方法提取每个特征子空间的主成分，摒弃噪声干扰。在进行分类时，则使用相同的非线性特征映射将测试样本映射到特征空间，然后将其向各个特征子空间的主成分进行投影，以测试样本在特征空间中映像与投影的残差大小来进行分类。该算法能一次区分多个类别，较快速，效果好。然后以降低特征子空间的维度、提高特征子空间的正交性为目标，保持局部内积为约束条件，优化投影残差分类器的核函数。尽量拉伸曲面流形，使得特征空间中每个类别的训练样本与这个类别的中心的距离最大化，以此降低特征子空间的维度。以特征空间中每个类别的训练样本与这个类别的中心来确定方向，使不同特征子空间的维度方向相互正交，以此来提高它们的正交性。中心化的内积矩阵决定了距离矩阵，也决定了样本点的所有空间结构，所以保持局部内积能保持局部结构。优化后的核函数显著降低了特征子空间的维度、提高了特征子空间的正交性，并取得很好的分类效果。接着使用半正定嵌入流形方法估计展开后的测地距离，使用测地距离来代替高斯核函数的欧式距离，利用新核函数进行投影残差分类，添加半正定嵌入流形方法后各个特征子空间的维度急剧的降低了，但识别率也降低了。后来又将拉普拉斯核矩阵应用于流形学习理论，拉普拉斯核矩阵能很好的体现类别之间的区别，将两个类别转化为完全正交的两个特征子空间。最后提出了一种基于内积的多类别流形学习方法。以降低与各个类别相对应的特征子空间的维度为目标，使各个特征子空间正交化、保持局部内积为约束条件，这是一个完全基于内积的算法。将目标函数和约束条件转化为一个半正定规划问题进行试验，取得了预期的效果。然后搜索测试样本的多个邻近的训练样本，寻找这几个邻近的训练样本在特征空间中的线性组合，以保持局部距离为目标计算测试样本流形展开后的坐标，直接在特征空间中用PCA进行投影残差分类，效果不错。　　本文采用两条路线来建立投影残差分类器，一是利用核函数并对其进行优化，一是利用流形学习方法或建立多类别流形学习方法。总的来讲，这两种方法的基本原理是一致的，都是通过非线性映射来将多类别映射为低维的、两两正交的特征子空间，然后在特征空间中使用投影残差进行分类。

其他文献

小波插值与自蛇模型在放大图像清晰化中的应用研究

如今,随着科技的发展,数字图像的分辨率越来越高,然而在实际应用中,图像极易受到外界各种条件的干扰,在很多情况下,要获得高分辨率的优质图像就变成了一件难事。例如,受到传

学位

数字图像放大视频图像放大小波变换自蛇模型

高校出题信息管理系统的设计与实现

计算机和网络技术的快速发展，给人们的学习、工作、生活模式的改变带来了深远的影响。随着计算机辅助教学的技术不断成熟，检测教学质量，评估学生学习效果的考试模式也将发生巨大

学位

高等院校出题业务信息管理系统软件开发

基于指数平滑预测模型的移动节点定位算法研究

随着“互联网+”行动计划被列入中国政府报告，物联网、大数据等相关产业得到迅猛发展，作为物联网纽带中极其重要一环的无线传感器网络也吸引着越来越多来自不同领域学者们的关

学位

无线传感器网络移动节点定位指数平滑模型ISPMCB算法

电子病历中关系型数据的质量分析可视化技术

随着信息化进程的发展，各大医院纷纷建立了信息化系统用于辅助医院的日常工作。其中电子病历是医学信息系统的主体，是医疗分析管理决策系统、医师临床诊断、远程会诊的数据中心

学位

信息可视化电子病历数据质量人机交互质量管理

深度稀疏自编码神经网络的特征学习研究

随着大数据时代的来临和发展，对这些海量的、复杂的数据进行数据的降维是一个必然趋势，深度学习在这块取得不错的成果。本文构建一个深度稀疏自编码神经网络，用以学习和研究深度

学位

深度稀疏自编神经网络数据降维特征抽取深度学习预测准确度

视频编码并行化关键技术研究

本研究分别针对实时视频编码和视频转码两种应用对实时性的不同需求提出并实现了不同层次的并行化编码算法。针对实时视频编码应用提出的并行化编码算法可以有效降低每帧图像

学位

视频编码视频转码并行化算法耗时控制

深空自主无线电参数估计技术研究

深空探测技术在科学、经济、军事和政治上都有着很大的意义，世界主要航天大国都在进行深空探测技术的研究，我国在“十五”、“十一五”、“十二五”计划中制定并已开展了包括月

学位

深空通信自主无线电参数估计现场可编程门阵列信道模型

CV-LeveISet方法的研究及其在气象目标分割中的应用

气象图像目标分割不同于一般的图像分割，这是由于气象图像目标繁多、整体上离散不连续、但是单个目标内部是连续的特性导致的，因此，要想准确分割出感兴趣的特定目标是存在一定困

学位

气象图像Snake模型梯度向量流水平集法目标分割

单指令集异构多核系统任务调度研究

性能不对称的单指令集异构多核处理器能够很好的适应程序行为的多样性,实现资源的按需分配,避免资源的过剩与不足,从而比同构多核处理器具有更好的性能功耗比,在低功耗绿色计

学位

单指令集异构多核处理器任务调度技术资源配置工作原理遗传算法

Ad Hoc网络ZRP协议在空间环境中的应用与研究

本论文的研究背景是空间中心知识创新工程创新项目：空间无线自组网网络协议关键技术研究。适用于空间应用的无线自组网网络协议研究仍处于起步阶段，需要克服空间环境特有的诸多

学位

空间无线自组网节能区域路由协议NS-2平台邻居发现分组投递率

多类别分类与流形学习问题的算法研究

与本文相关的学术论文