基于概率协同表示的多标签和多视图分类器学习

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:coosi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标签分类在现实生活中应用广泛,多标签分类算法可以分为两类:(1)问题转化方法,将多标签分类问题转化成二分类或者多分类问题,然后使用多分类算法进行分类。(2)算法适应方法,将多分类算法转化成相应的多标签分类算法。这些多标签分类算法都面临三个主要问题:(1)如何有效利用标签间相关信息;(2)数据不平衡问题;(3)算法处理大规模数据集时的有效性和效率。基于问题转化的多标签分类算法需要学习多个分类器,处理大规模数据集时算法运行速度慢,需要较大的存储空间。基于算法适应的多标签分类算法需要针对不同的标签获取数据不同的高阶特征,对算法处理能力要求高,往往模型非常复杂,容易过拟合。为了解决这些问题,本文首次将基于协同表示的分类方法应用在多标签分类问题中,基于问题转化方法构建了基于概率协同表示的多标签分类器Pro CRC-ML,模型分类正确率高,运算速度快,处理大规模数据时也有较高的效率。为了进一步提升模型分类性能,本文设计了集成Pro CRC-ML,即EPro CRC-ML,也在一定程度上解决了数据不平衡问题,基于Boosting集成方法的集成分类器有特征选择过程,针对不同的标签选择不同的特征子集,得到的EPro CRC-ML分类性能更好。相比单视图数据,多视图数据能有效改善模型训练。然而,现有的多视图学习算法大多只注重各视图之间的一致性或互补性,没有充分利用多视图数据。而同时考虑了多视图数据一致性和互补性的算法,由于模型复杂度高,处理大规模数据时能力受限。本文提出了基于概率协同表示的多视图分类器Pro CRC-MV,它联合最大化一个测试样例属于每个类的协同子空间的概率。Pro CRC-MV在协同表示过程中学习子空间,同时考虑多视图数据的一致性和互补性,可以获得较好的分类性能,同时模型复杂度低,运算速度快,处理大规模数据时仍能保持良好的性能。Pro CRC-MV具有基于自表示的子空间学习能力,因此本文将潜在表示学习与Pro CRC-MV相结合,使Pro CRC-MV可以更好地搜索协同子空间,构造一种新的分类器LPro CRC-MV,与Pro CRC-MV相比,LPro CRC-MV处理复杂数据的能力进一步增强。
其他文献
全球气候变化是人们迄今为止面临的最大环境问题,其中太阳辐射减弱造成的阴雨寡照天气是热点问题之一。水稻和小麦是中国两大主要粮食作物,稻麦生产受太阳辐射减弱的影响,同时也与水分管理或播期等农田管理措施密切相关。在太阳辐射减弱背景下,通过不同农田管理调控稻-麦生产,提高稻-麦生产应对气候变化能力,保障粮食安全生产。本文通过大田模拟试验,研究不同遮阴强度下不同水分管理或播期对稻麦生长及物候期的影响。采用田
叠鞘石斛为兰科石斛属植物Dendrobium aurantiacum Rchb.var.denneanum(Kerr.)Z.H.Tsi.栽培品的新鲜干燥茎,具有益胃生津,滋阴清热等功效,用于阴伤津亏,口干烦渴等症。根据现有研究,叠鞘石斛中主要含有多糖类及联苄类成分,前者具有提高免疫、降血糖等药理作用,后者具有抑制肿瘤生长,抗氧化等药理作用。叠鞘石斛收载于《四川省中药材标准》(2010版)和《四川省
仓储系统的基本功能是提供物品的存储功能,是现代物流运输中必不可少的一部分。随着土地及建设成本的不断增加,对仓储能力的要求也越来越高,仓储系统日益朝着紧致化趋势发展
文本情感分析是自然语言处理中的一个重要研究领域。细粒度情感分析旨在区分给定句子中每个特定方面/目标的情感极性,是文本情感分析的热点研究方向,也是近年来语义网和计算
经济全球化进程的深化使全球价值链对各国经济的影响越来越大,而产业结构调整是实现经济有效增长的重要形式。随着技术革命的深化,创新在各国经济发展中发挥着越来越大的作用
花卉苗木行业对建设花园城市,防风林与绿化带的种植有着非常重要的意义。近年来,在经济飞速发展和环保理念不断深入人心的形势下,人们对苗圃绿化植物的需求量快速增长。现有
“景观”是由实体的景物和抽象的群体认知共同组成的系统。与之对应,景观形塑的过程包含实体的开发营建和主观的文化建构,受到政治、经济等多重因素影响。景观研究作为考察明
党的十九大报告明确指出需要全面实施绩效管理。这表明绩效管理在企业管理中占有举足轻重的地位。作为绩效管理模块中的重要组成部分,绩效考核是选拔、奖励员工的重要方式,已
背景:类风湿关节炎(Rheumatoid arthritis,RA)是一种常见的慢性炎症性、自身免疫疾病,给患者造成了不可忽视的健康和经济负担,其主要发病机制为滑膜成纤维细胞(Fibroblast-li
最近,一种名为胶囊网络(Capsule Network,CapsNet)的新型神经网络引起了许多研究人员的关注。CapsNet是克服卷积神经网络缺点的一次伟大尝试,并且它在一些简单的数据集(如MNI