论文部分内容阅读
零样本学习主要用来解决训练阶段不包含测试类样本的情况下,如何对测试类样本进行正确分类的问题。零样本学习使得计算机具有了知识迁移的能力,对于探索实现真正的人工智能具有非常重要的意义。在零样本学习中,由于训练类和测试类不相交,为了实现知识的迁移,需要借助属性这一中间级表示。本文围绕着属性关系学习、属性特征学习、领域偏移和空域偏移等问题展开研究与探索,提出了四种基于属性的零样本学习方法。主要内容如下:1.针对经典的以直接属性预测模型为代表的零样本学习中每个属性被单独训练,属性与属性之间的关系被忽略的问题,提出一种基于属性关系图正则化的零样本学习方法。该方法首先根据类别-属性矩阵,利用相关系数计算属性与属性之间的相关性,并构建属性关系图;然后把属性学习看成是一个多任务学习,将属性关系图作为正则项加入到多任务属性学习中,学习多个属性分类器;最后根据学习到的属性分类器实现对测试样本的属性预测与零样本分类。2.针对多任务属性学习在属性关系与属性共享特征方面存在的不足,提出一种基于混合属性关系与属性固有特征的零样本学习方法。该方法首先假设每个属性都具有其固有特征,属性之间共享特征的多少与其二阶属性关系的强弱有关,构建基于二阶属性关系的属性特征学习;然后通过稀疏表示构建高阶属性关系,并将其统一到基于二阶属性关系的多任务属性学习中,对基于二阶属性关系的属性分类器进行修正,得到最终的属性分类器;最后根据学习到的属性分类器完成零样本分类。3.针对由特征空间到属性空间的零样本学习中存在的领域偏移问题,提出一种基于特征原型的零样本学习方法。该方法首先根据训练类样本和其类标签计算其特征原型;接着分别构建线性和非线性的类特征原型和类属性之间的模型;然后根据构建的模型和测试类属性向量合成测试类特征原型;最后通过比较测试类样本特征与类特征原型之间的距离完成零样本分类。4.针对生成式零样本学习中存在的领域偏移和空域偏移问题,提出一种基于耦合自编码与高斯混合模型的零样本学习方法。该方法首先假设训练类与测试类均服从高斯分布;其次通过耦合自编码对训练类和测试类的类条件分布进行联合建模以减少领域偏移;然后利用高斯混合模型对生成的测试类条件分布进行优化以校正测试类分布的空域偏移;最后基于最大后验概率完成零样本分类。该论文有图53幅,表16个,参考文献148篇。