论文部分内容阅读
现实世界的许多问题中通常存在大量的未标注样例,但有标注样例则比较少,因为给样例加标注需要耗费专业人员大量的时间和精力。主动学习通过选取那些最具代表性的无标注数据让专家去标注,从而使专家的标注任务量最小化。传统的主动学习只能进行具体的查询,效率较低。为提高效率,文章提出了一种新的基于泛化查询的主动学习算法,在4个ucI数据集上的实验验证了该方法的有效性。