基于学习标签相关性的多标签分类算法

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yjm17207928
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标签分类问题中每个数据样本往往对应一个由多个相关标签构成的标签子集合,而这个标签子集则反映了该样本所具有的多种语义意义。考虑到传统分类问题中每个样本有且仅有唯一的类别标签,很显然地,多标签分类是传统分类问题的一种广义版本。然而这种广义性却不可避免地使多标签分类问题的解决变得更加困难。直观上,这些不同的标签往往在一些语义空间上相关,并且都对应着相同的输入特征空间。因此,通过有效地利用标签相关性能够明显地促进多标签分类过程。而目前大部分方法往往都存在一些不足,一方面它们常把标签间相关性作为一种先验知识加入到模型中,但是这种先验相关性却不能准确地描述标签间实际存在的相互依赖关系;另一方面这些方法也都无法解决不完全标签信息下的多标签分类问题。本文中我们提出了一种统一的框架通过对标签相关性和多标签模型进行联合学习,并且在该框架中利用矩阵的低秩结构以更准确地反映标签间所存在的复杂相关关系。同时为了解决不完全标签信息下的多标签分类问题,我们通过利用标签相关性对原始不完全的标签矩阵进行增强以构造一个补全标签矩阵加入到模型中。然后提出了一种交替迭代优化求解算法来准确地求解该模型中所涉及的优化问题。在实验部分,我们基于五种不同的评价标准并通过七个真实图像和文本数据集上的对比实验结果论证了本文所提出的算法分别在分类性能的准确性,标签相关关系的语义合理性以及缺失部分标签信息时算法的鲁棒性上较于其他方法具有明显的优势。
其他文献
传统的文本分类算法需要大量的标注文本,但标注大量训练文本需要艰苦而缓慢的手工劳动,从而制约了整个分类系统的构建。增量学习技术可以利用少量的已标注文本对大量的未标注
人脸是人们社会交流中所关注的焦点,在辨别身份和传递感情方面起着重要的作用。由于人脸识别技术在视频监控、访问控制、信用卡验证、多媒体数据库检索以及安全等领域有着广
随着企业信息化不断深入,企业资源安全成为最为急需解决的问题之一。访问控制对系统资源的安全性至关重要。访问控制的目标是防止用户对系统资源进行非授权的访问。分析研究
随着信息技术的迅猛发展,用户需求的不断升级,基于Internet技术的应用以惊人的速度渗透到社会生活的方方面面,Web站点俨然已成为一个巨大的信息集散地。如何快速、高效、准确
网络是人们获取知识和传递信息的桥梁。然而,随着近年来internet的高速发展,网络上信息的数量也呈现指数级的增长,在这一背景下,互联网使用者往往无法轻松找到需要的信息,一
随着人类社会和计算机技术的发展,信息化已成为社会发展的趋势。信息技术的发展也促成了高校的信息化,随着高校教育的普及,高校中的应用系统不断增加,数字化校园已成为各高校的发
随着世界信息技术的发展,信息化水平成为了国家之间综合实力的主要体现。谁能将信息根据需要实时、可靠的分发给用户谁就拥有信息优势,从而处于主导地位。这也是目前信息分发
随着互联网的不断建设和发展,互联网用户对网络应用多样化和网络服务性能的需求越来越高,特别是网络物理传输线速的进一步提升都极大地增加了高速主干网络测量和管理的难度。通
近年来,随着数值预报技术的发展和气象卫星探测能力的不断提高,人们越来越多地将卫星资料应用于数值预报中,并取得了明显的进展。然而,卫星资料的使用,云判断和云型分类是首要解决