基于生成对抗网络的批量式主动学习方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:xinpasi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器学习的快速发展和广泛应用,为解决机器学习任务中数据标注成本问题的主动学习领域具有重要的研究价值。最近,一些研究工作将生成对抗网络引入了主动学习领域,通过生成对抗网络可以直接标注模型的决策边界,并证明了决策边界标记可以提高模型的准确性。另外,批量式主动学习在一定程度上缓解了常规主动学习方法所存在的时间消耗问题。然而,主动学习在每轮迭代中最耗时的步骤是对模型的重新训练过程,批量式主动学习方法并没有对其进行改善,因此还应考虑使用其他方法来简化训练过程。为了结合了批量式采样模式和模型决策边界标记的优点,本文提出了一种新的基于生成对抗网络的主动学习方法。该方法通过生成对抗网络直接让人类专家标注模型决策边界,并通过决策边界标记批量地选取样本。与常规主动学习方法相比,该方法避免了在每轮迭代中重新训练模型,减少了计算负担和时间成本。另外,本文还提出了一种基于聚类的初始种子采样策略,对所提出的基于生成对抗网络的主动学习方法进行了改善,该策略通过聚类估计样本的总体分布情况,能够根据样本分布有针对性地选取算法的初始种子。通过在三个数据集上的实验结果表明,基于生成对抗网络的主动学习方法能够有效地减少构建机器学习模型的数据标注成本,基于聚类的初始种子采样策略能够有效地提高该方法的性能。为了在批量采样的过程中同时考虑多种样本选择标准,本文还提出了一种基于多标准的批量样本选择策略。该策略将样本的信息性、代表性和多样性共同作为批量采样的约束条件,进而设计了一个采样目标函数,并提出了其具体的优化流程。将基于多标准的批量样本选择策略与基于生成对抗网络的主动学习方法相结合后,本文提出了一种新的基于两阶段采样的批量式主动学习方法,即BALTS,该方法同时拥有这两者的优点。通过在三个数据集上的实验结果表明,基于多标准的批量样本选择策略能够有效地提高基于生成对抗网络的主动学习方法的性能,BALTS能够更高效地减少构建机器学习模型的数据标注成本。
其他文献
静电纺丝是一种利用高压电场将溶液或熔体加工成纤维的制造技术,具有广泛的应用前景。现有的有关静电纺丝的理论非常不完善,难以很好地指导静电纺丝工艺创新和优化。为此,本
本体异质结有机光电探测器制备工艺简单、性能易优化、成本低、环境友好。随着有机半导体光电性能的提升和器件物理的发展,本体异质结有机光电探测器的性能参数不断改善,提高其外量子效率(EQE)以及探测灵敏度成为亟需攻克的科学问题。以界面陷阱诱导外电路电荷隧穿注入为工作机理,可制备出具有单载流子传输特性的倍增型有机光电探测器。倍增型有机光电探测器的单载流子传输特性,可有效抑制光电探测器的暗电流密度,提高其弱
新丝绸之路倡议的提出引起了国内外各界的广泛关注及讨论。译者选取波士顿大学的新丝绸之路研讨会进行了模拟交替传译实践。交替传译是一个跨语言、跨文化过程,包括接收源语
目的前瞻性地研究131I治疗对分化型甲状腺癌(DTC)患者卵巢贮备功能的影响。材料与方法76例经甲状腺双侧叶全切或次全切除手术,术后病理确诊为DTC并计划于我科行131I治疗的患者
我国正处于社会急剧变革的转型期,随着新公共管理理论的发展,政府职能转变,社会公众对政府的要求和期望持续提高。作为政府公共权力的执行者——公务员发挥了不可替代的作用,
公版书作为人类社会文明传承的产物,对公版书的开发,既是一次窥见知识文化延续的契机,也是一次全新的经典再诠释。在新的技术条件和阅读生态环境下,经典图书市场正处于转型阶
基于哈希的大规模图像搜索技术近年来得到了广泛的应用,大量的集中式算法已被提出并且取得了很好的性能,特别是基于深度学习的哈希算法极大提高了搜索精度。然而在实际应用中,数据规模越来越大,数据以分布式的方式分散在不同位置,将所有数据集中到一个计算中心进行训练,将导致过高的传输和计算开销。因此,需要提出新的分布式哈希搜索算法,分散在不同位置的样本独立训练,通过有限的参数传递实现集中训练的效果。交替方向乘子
HSAF是生防产酶溶杆菌中新发现的一种结构新颖、生物合成和作用方式独特、对环境安全广谱抗真菌和卵菌的次生代谢产物,具有开发为绿色杀真菌或卵菌剂的应用前景。然而,产酶溶
对二甲苯简称PX,是一种重要的基本有机化工原料,是聚酯产业的源头。利用甲苯与甲醇烷基化高选择性制备对二甲苯工艺是一条经济高效的生产路径。但普通ZSM-5催化剂外表面的酸
制冷装置是船舶辅机的重要组成部分。现代船舶正向着网络化、智能化的方向发展,船舶制冷系统也变得日益复杂。船舶制冷系统若发生故障,将影响货物的质量与船员的工作效率,造成严重的经济损失,所以保证船舶制冷系统的正常运行,在降低运行成本、提高船舶运输经济性方面有着重要意义。深度学习在处理复杂问题方面具有明显优势,将深度学习与故障诊断相结合已逐渐成为一个研究热点。本文针对传统故障诊断方法对于在制冷系统故障数据