利用任务相关性的多任务主动学习

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:xpzcz1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在监督学习中,为了获得高效的机器学习模型,需要大量的已标记样本进行训练,导致数据标注代价高昂。主动学习通过让模型有选择性地挑选未标记样本进行标注,能够以更低的标注代价学习出更高效的模型。目前已有大量的主动学习算法被提出,但大部分主动学习研究主要集中在单一任务、单一标记集合和单一模型的问题设定下。尽管这些方法在部分任务上取得了不错的效果,但是往往难以适用于多任务的实际应用场景。总结而言,现有多任务主动学习工作存在以下几个局限性:1)大多数算法都是针对单个任务目标启发式设计的,不能泛化到不同的其他任务上;2)未有效利用任务之间的关系,在选择未标记数据时仅考虑单一因素;3)现有主动学习实现未使用一个统一的形式进行整合,难以在多任务中布置使用。本文针对上述问题进行研究,主要工作包括:1.提出一种基于元学习的主动查询算法,提升主动学习在多任务中的泛化性。借鉴元学习的思想,通过设计一系列专门适用于主动学习的元特征,这些元特征不依赖与特定的学习任务和指定的基模型类别,可以实现跨任务和跨模型的主动采样功能。通过使用大量主动学习任务上的经验数据,学得一个在特定学习状态下元特征到未标记样本信息量的映射关系,将其作为选择未标记样本的指标。实验结果表明该方法相比传统方法能有在新任务上取得较好的效果。2.提出一种考虑标记之间相关性的多任务主动学习算法,有效利用标记之间关系,减少冗余标注。首先,将标记排序与阈值学习相结合,提出了一种有效的多标记分类模型。并在此模型的基础上,提出了不确定性和多样性的主动查询方法。实验结果显示该方法能够有效降低多标记学习的标注成本。3.设计并开发一款逻辑统一的主动学习工具包ALipy,降低主动学习实际应用的工程成本。该工具包根据主动学习任务之间的一致性,将主动学习拆解成独立的9个模块,不仅用统一的接口实现了主流20多种主动学习算法,还支持7种常见的主动学习问题设置,并提供了完整的试验流程工具。该工具包已在GitHub上开源并有详细的说明文档,可以使用PyPI快速安装。
其他文献
窄带物联网(Narrow Band Internet of Things,NB-IoT)技术是由3GPP提出的一种新型低功耗广域网物联网技术,属于移动蜂窝网络接入技术的范畴,它同时拥有低功耗、大连接、广覆盖以及低成本等特点。NB-IoT能够在短短几年时间内得到如此迅速的发展,其超低的终端模组能耗绝对是最主要的原因之一,诸如NB-IoT在远程抄表、智能水务以及共享单车等多种应用场景下的实现,都充分体
学位
人类的大脑是一个十分精密而又复杂的系统,而其复杂的特性也使得它易受到疾病的攻击。近些年来,随着人工智能技术尤其是机器学习及深度学习的飞速发展,利用大脑的影像数据及机器学习方法来分析和诊断脑疾病的方案也受到了广大研究者的关注。从大脑影像数据出发,可以构建其对应的脑网络。目前现有的脑网络分类研究工作多是基于图论基础的,如子图挖掘以及图核方法等,但是这类的浅层模型无法有效地提取脑网络数据中存在的高阶非线
学位
<正>天翼数字生活科技有限公司作为中国电信数字乡村平台的运营者,积极践行央企当担,以乡村振兴战略为导向,面向村镇基层打造综合信息服务平台,目前已经覆盖全国超过36万个村。天翼数字生活先后在广东南雄里源村、市口村开展了“天翼数字乡村”平台建设,以当地特色产业发展为支撑,以美丽乡村建设为载体,以数字乡村建设为导向,实现光纤到户、4G/5G有效覆盖。
期刊
随着多媒体技术的发展以及电子设备的普及,数字图像信息的数量呈现爆炸式地增长。人们为了分享生活和保存回忆,将各种图片以及视频信息上传到网络平台。如何管理以及分析这些数据信息就成为了亟待解决的问题。其中以人脸为焦点的照片得到了更多的关注。因此人脸聚类的研究具有重要意义。人脸聚类是将图像根据不同身份类别进行分组的过程。由于人脸图像受到光线、角度、遮挡等外界因素的影响,聚类效果往往达不到人们的预期。近年来
学位
城市交通流量预测是城市计算中的重要任务,对城市发展以及居民生活服务等具有重要意义。随着智慧城市建设的普及,发达的一线城市已经具有较为完善的智慧交通系统,但是仍存在很多非一线的发展中城市或区域,面临数据缺失和数据收集系统不完善等问题,无法较好地开展交通流量预测和相关研究工作。针对以上的问题,近一两年来,已有一些跨城市计算工作使用迁移学习方法。然而,由于城市居民的出行数据具有独特的时空依赖性,并且市民
学位
表面活性剂(S)-聚合物(P)二元复合驱(简称SP)是1种新型的3次采油的技术,它具备了无碱、不结垢、高粘弹性等特点,及良好的增加采收率效果,已在辽河、新疆、胜利等油田开展矿场试验,增油效果明显[1]。石油磺酸盐是1种驱油用表面活性剂,其优点是价格低与原油配伍性好,已成为大庆油田提高原油采收率的主要驱油用剂,由碱(A)-表面活性剂(S)-聚合物(P)组成的三元复合驱(简称ASP)在油田广泛使用,而
期刊
二元体系(聚合物—表面活性剂)与三元体系比较,因为没有了碱的协同作用,仅仅依靠低的界面张力,很难达到三元体系的驱油效果。为提高二元体系驱油效果,除优化产品配方外,还需综合考虑提高体系抗吸附性能、产品乳化性能等。文中通过开展室内驱替实验,研究了无碱二元复配体系(简称二元体系)中石油磺酸盐浓度、油水界面张力、二元体系吸附性、乳化性等因素对驱油效果的影响。
期刊
供热通风与空调工程的节能控制措施是在一定的技术条件下实现的,能够保证建筑室内空间的舒适性以及安全性。合理应用供热通风与空调来达到节能降耗和降低污染等目的,具有重要意义。本文针对供热通风与暖通空调工程施工技术要点给予了全面、深入的分析,并结合实际情况提出了相应的措施。
期刊
目的:观察两面针含漱液联合牙周基础治疗在牙周病患者中的应用效果。方法:选取2021年1月至2022年12月该院收治的120例牙周病患者进行前瞻性研究,按照随机数字表法将其分为观察组和对照组各60例。两组均进行牙周基础治疗,在此基础上,对照组给予复方氯己定含漱液治疗,观察组给予两面针含漱液治疗,两组均连续治疗1个月。比较两组治疗前后牙周病指标[出血指数(BI)、牙龈指数(GI)、菌斑指数(PLI)、
期刊
《义务教育语文课程标准(2022年版)》提出“教-学-评”一体化要求,教师应树立“教-学-评”一体化的意识,“教-学-评”一体化有利于克服教、学、评分离的弊端。本研究紧扣“教-学-评”一体化的初中语文阅读教学设计,按照其“为什么——是什么——怎么办”的逻辑思路开展研究。“为什么”主要指向本文的第一章和第二章。首先,“教-学-评”一体化是学习型社会的需求,是学生核心素养发展的要求,更是语文课程评价改
学位