基于特征空间变换的半监督学习

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：smileye1

【摘要】

：

半监督学习旨在仅有少量标注数据集和大量未标注数据集的基础上获得一个良好的学习器。其中,协同训练算法是半监督学习领域最重要的算法之一。该算法的大体思想是先利用极少

【作者】

：

章文

【机构】

：

中国科学技术大学

【出处】

：

中国科学技术大学

【发表日期】

：

2009年期

【关键词】

：

半监督学习协同训练特征集划分 K-L变换能量函数 web文档分类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

半监督学习旨在仅有少量标注数据集和大量未标注数据集的基础上获得一个良好的学习器。其中,协同训练算法是半监督学习领域最重要的算法之一。该算法的大体思想是先利用极少的训练数据分别在两个特征集合上训练两个分类器,然后每个分类器对每个未标记数据进行分类,并从中挑选出置信度最高的p个正例数据和n个负例数据作为新的训练数据加到对方分类器的训练数据集中,使得对方分类器根据新训练集进行更新。根据理论分析,上述过程不断迭代重复能使得分类器逐渐由弱变强。然而协同训练算法的局限性在于它需要两个在充分训练集下足够优秀,且相互独立的特征集。而在现实世界中,满足如此两个苛刻约束的问题十分罕见。针对协同训练的局限性,本文做了比较有效的工作以满足两个约束条件。它的主要思路是将源数据集经过K-L变换映射到一个各维互相正交的正交空间中,然后应用某种划分算法将转换后的数据集特征集合划分成两个满足协同训练约束条件的高质量的子集合,本章介绍了两种特征集合的划分方法,分别是:贪心的划分算法和能量差驱动方法。为了衡量子集合的质量,我们定义了一个基于特征值的能量函数。试验结果表明该方法取得了良好的分类效果。此外,注意到协同训练的研究主要集中在分类问题上,本文又提出了一种新的协同训练的回归算法(SSRFT)。在这种算法中,除了利用已有的基于特征空间变换的划分方法得到两个满足约束条件的特征集外,针对回归问题中需要两个差异性较大的回归器的约束条件,利用了两个迥异的回归器。同时,将此算法应用到了信息检索领域取得了较理想的效果。实验结果证明基于SSRFT的web文档归类方法比已有的半监督回归方法COREG效果更好,甚至同基于足够训练集的支持向量回归的web文档归类方法相当。

其他文献

感应电机无速度传感器矢量控制研究

电气传动技术是推动工业自动化发展的关键技术之一，由于直流调速系统维护困难和难以实现高速驱动等缺点，高性能的交流调速系统应运而生，逐渐成为电气传动控制的主要发展方向。由

学位

转子磁场定向控制感应电机速度估计矢量控制速度传感器电气传动

Mobile Ad Hoc Network与Internet互联时的网关转发策略的研究

移动Ad Hoc网络(MANET)以其灵活、可自我配置及易于实施而在未来无线及移动通信中具有重要地位。在可预见的未来,推动网络技术发展的一个关键就是满足用户的各种个性化需求,

学位

移动自组织网络Internet互联网关转发策略主机路由

针对排球场景的图像检索

图像检索作为多媒体信息检索技术的一个主要组成部分，在信息检索领域占有举足轻重的地位。因此图像检索得到了快速的发展，并产生了许多关于图像检索的算法。根据不同的实际问题

学位

排球场景图像检索多媒体信息检索图像预处理单元格熵

基于数据驱动的软测量建模方法研究及其工业应用

软测量技术是先进控制技术的重要组成部分,也一直是过程控制领域研究的热点之一。其能够提升企业对产品质量的直接监控,并通过先进控制与优化技术实现降低生产成本的作用,提

学位

软测量数据驱动最小二乘支持向量机GRIN聚类算法Chameleon聚类模糊曲线法高斯过程

非线性双性别人口发展模型创新暨中国出生人口性别比参数识别与评估(2000-2006)

党的十六大提出,21世纪头20年,是我国加快发展的战略机遇期,我们要集中力量,全面建设小康社会。十六届四中全会进一步提出了建设社会主义和谐社会的目标,要求人口发展与经济

学位

非线性双性别模型系统辨识最优化

基于网络分量分析的盲源分离技术研究及应用

盲信号处理(BSP)是二十世纪九十年代发展起来的一个研究领域。盲源分离(BSS)是盲信号处理的一个重要的研究课题，它具有坚实的理论基础和广泛的应用前景。独立分量分析(ICA)是

学位

盲信号处理盲源分离独立分量分析网络分量分析

基于动态神经网络的移动机器人导航方法的研究与实现

机器人自主导航是移动机器人研究领域中的一个核心技术和难点问题，涉及到机器人的感知、规划、执行等诸多方面。随着机器人应用范围深度和广度的延拓以及人工智能科学的发展，机

学位

移动机器人自动导航人工智能机器学习

基于特征空间变换的半监督学习

其他学术论文