基于半监督方法的新类别发现学习研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:chen95127
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当前机器学习的研究中,面对真实世界应用场景开放性的分类已经受到越来越多的重视,且已经出现了一些研究领域,如零样本学习(Zero-Shot Learning)、类别增量学习(Class-Incremental Learning)等。本文对一种新的面对真实世界开放性的学习框架——新类别发现学习展开研究。新类别发现学习将来自已知类别的标记数据和来自已知类别和新类别的无标记数据共同作为训练样本进行学习,学习目标是构建一个能够分类包含所有已知类别和新类别的多类分类器。新类别发现学习和半监督学习有很大的相似性,可以看做半监督学习面向真实世界开放性的一种拓展。但是,半监督学习的无标记数据均来自标记数据中的类别,因此现有的半监督学习方法无法挖掘出新类别发现学习中的新类别知识,学习到能够分类包含新类别在内的所有类别的多类分类器。本文在现有半监督学习方法的基础上,对半监督学习基于图的方法中著名的局部和全局一致性方法局部和全局一致性方法进行了改进,提出了一种基于半监督图方法的新类别发现学习方法。该方法通过(1)迁移标记数据中用于区分已知类别的知识至用于区分所有类别,(2)挖掘无标记数据中的新类别信息并构建类别球模型,(3)建立所有类别标记与无标记数据的联系,使原有的局部和全局一致性方法具有学习新类别发现学习中新类别知识的能力,通过借助样本的近邻样本使原有的局部和全局一致性方法具有分类新样本的能力,弥补了局部和全局一致性方法在解决新类别发现学习问题时的不足,并保留了原有方法利用局部和全局一致性假设发挥出借助无标记数据的数据分布进行学习的优势。实验表明,该方法很好地发挥出了无标记样本帮助已知类别学习、提高分类性能和模型的泛化能力的作用,也挖掘并学习到了无标记数据中包含的新类别知识,总体上有着良好的分类性能,可以较好地解决新类别发现学习问题。
其他文献
超短超强激光与物质相互作用是当今激光学科研究的前沿方向。作为X射线的主要产生方法之一。利用超短超强激光与单电子相互作用时的Thomson散射产生X射线的优点在于作用模型
近些年,真空电子器件逐渐朝着“五高一小”的目标发展,即高频率、高功率、高增益、高效率、高可靠性和小型化。尤其是所需的电磁波发射源的工作频率逐渐迈向太赫兹频段,传统
人体姿态估计的目的是提取人体的关节所在的位置。研究人体姿态估计可以实现对人体进行更加精细的标注,获取人体当前的身体姿势,进行人体行为识别或动作跟踪。当前人体姿态估
雷达是现代战争中的“千里眼”,是伴随电子战这类全新的战争形式出现的。目前,远程雷达探测技术正高速发展和快速更新。“隐身”则是雷达的对立面,隐身技术是让对手“看不见
2022年北京冬奥会、冬残奥会的成功申办,催动了我国残疾人冬季两项的建立,虽然该项目在2018年平昌冬残奥会上崭露头角,但也暴露出在比赛中运动员的射击技术无法正常发挥这一
在染料及助剂用量、水资源与电能的消耗上,低浴比染色机相比传统染色机具有明显的优势。主动走布染色机是一种新型低浴比染色机,它取代了传统的溢流染色机由喷嘴喷射染液推动
随着近年来移动通信技术的迅猛发展,移动用户数量急剧增加,移动数据流量也将呈爆炸式增长。然而,频谱资源却非常紧缺,因此,用户数量大、频谱资源紧缺的矛盾日益突出。为了解
随着计算机应用技术的发展与人工智能技术的兴起,如何快速且高效的从日益剧增的互联网数据中获取有价值的数据,是当前自然语言处理领域的重要研究问题。属性抽取(Attribute E
激光和等离子体相互作用由于其丰富的物理现象和广阔的应用前景而引起了科学家们的极大兴趣。而该领域的一个主要特征就是高能电子的产生,为了提高电子从激光中获得的能量进
内部威胁作为严重的信息安全问题受到广泛关注和重视,随着信息系统内部不安全事件的不断发生,不论是员工误操作还是出于某种目的得行为,如何有效检测和预防内部威胁的发生成