基于深度森林的多标记学习方法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:wmrik
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的高速发展,人类进入到信息爆炸的时代,机器学习技术得到了广泛的研究与应用。多标记学习问题是机器学习的重要研究问题,存在于现实生活中的很多地方。在多标记学习中,每个样本都与多个标记相关联,如何利用标记的相关性来构建模型是关键。深度森林作为机器学习领域的一项新技术,它的提出开辟了不同于深度神经网络的新路径。本文针对如何将深度森林应用于解决多标记学习问题展开了一系列研究,主要取得了以下创新成果:1)提出了多标记深度森林方法(MLDF),首次将深度森林应用于多标记学习,为该领域的研究提供了一个新思路。该方法依靠深度森林的级联结构探究和利用了标记之间的相关性。实验表明了 MLDF可以学习到标记间的相关性关系,证实了其性能具有一定的优越性,并验证了模型具有很强的可扩展性。2)提出了度量敏感的多标记深度森林方法(MA-MLDF),解决了在不同需求下优化不同度量的问题。该方法主要采用了度量敏感的特征重用机制和度量敏感的层级生长机制,这使得模型可以根据指定的度量进行调整。实验表明了MA-MLDF显著优于现有的一些方法,并证实了两种机制的有效性。3)提出了半监督多标记深度森林方法(SS-MLDF),使得模型在部分标记缺失时可以利用无标记样本来辅助有标记样本进行训练。该方法主要通过tri-training方法对无标记样本进行标记,并利用了mixup技术丰富样本来提高模型的泛化能力。实验表明SS-MLDF方法在半监督情况下优于现有方法。
其他文献
随着世界经济发展模式的深刻变革,物流作为第三方利润源泉愈发受到国际社会的关注。广义的物流包含运输、存储、加工、配送、信息处理等过程。同类机调度属于物流生产加工领
随着现代工业的逐步发展,越来越多的工厂采用机器人来代替人类完成某种特定的任务,这样不仅可以将人从工作岗位上解放出来,而且更重要的是机器人可以提升工作效率和工作品质
网格参数化是计算机图形学与数字几何处理中基本又十分重要的问题,许多数字几何处理的相关问题,如纹理映射,压缩形变,编辑,网格优化以及网格细分的应用中,都需要参数化作为解
大型电力系统中变压器的局部放电往往会带来巨大的电力安全隐患,可能造成难以估量的经济损失。局部放电常会产生超声波等物理现象,通过对超声波信号的检测可以有效监测电力系
色烯又称苯并吡喃,是一类重要的双环类化合物。色烯类衍生物常含有2H-色烯和4H-色烯两种基本骨架结构的化合物广泛存在于天然产物和药物中。因为其独特的结构和药理活性,所以
随着物联网的发展,人机交互概念得到进一步的拓展,人体活动信息需要及时的被采集,并得到有效的处理和识别,来进一步辅助和支持人类行为活动,因此,如何在当前背景下更有效的进
高校各个系统蕴含着丰富的学生数据,但是这些系统基本上缺乏综合分析和辅助决策能力。为了利用学生事务数据,挖掘其中隐藏的信息和规律,从而更好地了解高校学生的生活和学习
温度测量与国防、军事、科学研究、工业生产等活动密切相关,不同的测温场景,对测温精度和温度显示效果的要求也不一样。本文基于双色测温理论,结合数字图像处理技术,实现燃烧
本文利用表面等离子体共振(也叫SPR,英文全称Surface Plasmon Resonance)检测技术来实现痕量检测溶液中的汞离子。该检测法的优点是检测灵敏度高,检测速度快并且可以重复利用多
二茂铁具有独特的空间结构能够构建平面手性,具有平面手性的二茂铁已经成为手性二茂铁膦配体的骨架而被应用。其中,最著名的是具有平面手性和中心手性的二茂铁膦配体Josiphos