论文部分内容阅读
计算机视觉的主要研究目标是有效地根据图像等多维数据建立人工智能系统从而认识现实世界。图像分类是计算机视觉领域基础研究问题,是理解和分析图像内容的重要技术方法。而在当今大数据的时代背景下,处理大规模图像问题已成为研究趋势。同时数据量大、标签信息复杂而丰富等问题也向传统的分类模型和特征提取方法提出了严峻的挑战。如何挖掘和利用视觉信息、建立分类模型来有效处理大数据分类问题是本文研究的目标。结合类别结构和特征学习两个研究点,本文提出了一系列的方法,主要研究内容和贡献如下: (1)提出基于层次结构的多级判别字典学习算法。判别(有监督)字典学习算法相比于无监督字典学习方法,将判别性准则融合到字典学习中,捕捉有判别力的信息。然而,这些方法伴随着非常高的时间复杂度,尤其在处理较多类别的图像时,制约了其在大规模数据上的可用性。本文提出的这个算法,将层次化的类别结构运用到判别字典学习的算法框架中,将原始问题分解。层次化训练和预测机制显著降低时间复杂度。另外,结合类别结构蕴含的视觉性质,采用层次化的判别字典学习方法,位于不同层的字典被用来捕捉不同尺度的视觉信息,并结合字典继承策略来提升较低层次节点的可分性。相比于传统的判别字典学习方法,该算法能有效地捕获和利用丰富有判别力的信息,大量实验证明其在处理大量类别的分类问题时展现出的良好性能。 (2)提出联合判别学习特征和类别结构的算法。在层次化模型中,类别结构影响着信息的传递,对模型性能(准确性与效率)起着决定性的作用,因此如何定义一个好的类别结构至关重要。传统的层次结构学习多基于预先计算的特征表示,不同层的分类子任务建立于相同的特征空间,当处理到较低层时,不充足的判别信息导致节点间的低可分性。我们提出的这个算法,将深度特征学习的能力引入到类别关系建模中,基于多层特征的动态抽取和学习,充分利用视觉信息来建模类别关联性,从而得到更合理的类别结构和分类模型。实验表明,该算法相比于其他层次化模型方法在类别结构学习和分类两个问题上非常有效;相比于基于平坦类别结构的特征学习方法,该算法则在测试效率上展现了明显的优势。 (3)提出基于特征学习的共享模型分类算法。不同于层次化模型框架,将图像分类问题形式化在多任务共享学习框架下,利用任务(类别)之间信息的共享来提升整体系统的分类准确度。基于不同的先验假设,将特征学习和多任务共享机制相结合:一是采用树结构先验,提出一种基于树先验的层次化特征共享分类算法,实现任务(类别)之间多层信息的传播和共享;二是采用特征子空间假设,提出一种基于正则化约束的适应性共享分类算法,目的在于鼓励类别之间选择性地共享信息,同时捕捉各自的差异。本文利用一个参数组合,加以不同的正则化约束来实现这一目标。除了用于对预提取特征的分类模型学习,还将此共享机制扩展至深度神经网络框架,利用类别之间的关联性增强系统的判别能力。大量实验验证了算法的有效性,并展示出将特征学习和共享学习范式结合的显著优势。