论文部分内容阅读
针对数据分布不一致学习问题,本文提出了一种抽取辅助训练集子集的数据分布不一致学习算法。该算法首先计算辅助样本集合与目标样本集合的相交区域,然后抽取相交区域的辅助样本辅助目标训练集进行学习。在数据分布不一致学习背景下,辅助训练集与目标训练集通常有相交的区域,因此本文方法可以有效地提高分类器在目标训练集上的分类性能。在新闻文本分类数据集上的仿真实验充分验证了本文算法的有效性。