弱监督多标记学习

来源 :南京大学 | 被引量 : 0次 | 上传用户:real_dolia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在很多现实的机器学习任务中,一个样本同时拥有多个标记,而整个数据集内仅有少量样本、甚至没有样本拥有完整标记。对这样的数据样本进行学习,就是弱监督多标记学习(Weakly Supervised Multi-Label Learning,简称WSML学习)。此类问题在现实应用中广泛存在,但以往研究较少,是机器学习领域面临的一个新挑战。本文针对弱监督多标记学习开展研究,主要工作包括:1.有完整标记样本的弱监督多标记学习。对数据集中仅有少量样本拥有完整标记的情形,本文提出一种新的CUR矩阵分解技术,基于完整标记所对应的行信息来恢复缺失标记。通过理论分析显示了所提出方法在现实条件下的有效性,并通过实验进行了验证。2.无完整标记样本的弱监督多标记学习。对数据集中没有样本拥有完整标记的情形,本文提出一种新的矩阵补全技术,能利用样本特征与标记关系等辅助信息恢复缺失标记。本文通过理论分析显示了所提出方法在现实条件下的有效性,并通过实验进行了验证。3.顶端排序的弱监督多标记学习。排序在前的标记往往比排序在后的标记更重要,为此本文设计了一种新型评价准则PRO Loss,通过同时考虑标记的分类和重要性排序,能较好地满足上述需求;在此基础上,本文提出了相应的优化算法,并通过实验验证了其有效性。4.实值输出的弱监督多标记学习。多标记学习任务通常考虑离散输出值,而很多实际应用涉及实值输出。为此,本文提出了一种基于核范数最小化来利用标记关系,并通过近端梯度下降和交替方向乘子法优化求解的方法。实验结果验证了本文方法的有效性。
其他文献
由于我国保险业发展较晚 ,又面临着经济转型后的对外开放局面 ,产业的内、外环境具有很大的不确定性 ,但从总体来看发展环境是有利的 ,关键在保险业是否能准确定位
一堂课会不会取得良好的效果,关键在于是否有一个引领学生心驰神往的开头。课堂导入是课堂教学环节中的重要一环,它犹如一把开启学生兴趣大门的金钥匙。设计引人入胜的开头,
分析了农产品物流的生产、需求、流通特性,以及国外农产品物流的3种典型模式和国内的6种典型模式,结合陕西农产品物流的优势和存在的问题,提出了基于供应链的陕西农产品物流
目的修订并提高养阴镇静丸的质量标准.方法采用显微鉴别法对处方中的五味子、珍珠母、朱砂、茯苓进行定性鉴别。采用高效液相色谱法测定五味子中五味子醇甲的含量。结果五味
目的总结前置胎盘伴胎盘植入的危险因素、诊断和治疗经验,为胎盘植入的早期诊断及规范治疗提供指导。方法回顾性分析2010年1月至2012年12月广州医学院第三附属医院前置胎盘伴
<正>前言回肠造口术是将末端回肠拖出腹壁做一个造口,已达到排泄临时改道,防止吻合口瘘的目的,是某些结肠,直肠疾病必需的手术。造口周围粪水性皮炎是由于造口术后肠道分泌物
会议
一堂较好的语文课应该是这样的:学生积极思考,踊跃发言,教师情绪饱满,循循善诱,师生配合默契,课堂气氛活跃而有所得的课。也只有这样的课,才能达到理想的教学效果。著名教育
针对作为降低航天任务成本重要手段的可重复使用航天器技术在未来的应用需求,对可重复使用航天器概念进行了探讨,给出了系统级可重复使用和部件级可重复使用航天器的定义。分
习近平总书记的协调发展,既是对中国共产党人协调思想的坚持,又根据发展环境和条件的变化被赋予了许多新的内涵,是引领和推动我国经济发展的新发展理念的重要组成部分。协调