论文部分内容阅读
随着科学技术的进步,电子设备的发展,特别是携带照相功能智能手机的普及和互联网的应用,视觉数据数量迅猛增长,有效的图像分类、检索技术成为人们的迫切需求。传统的基于文本的图像分类技术需要额外的人工标注,但人工标注的成本高,缺点明显。如何利用图像自身固有的属性进行图像分类、检索成为了近些年计算机视觉和模式识别领域的研究热点。 传统图像识别技术大多基于图像的底层特征,用底层特征来表示图像,进而建立分类器识别图像,但底层特征往往缺乏语义,造成了“语义鸿沟”,导致计算机能够识别的底层特征不能被用户理解,从而无法从用户处获得有效的交互信息以提高分类检索效能。为缩小语义鸿沟,图像视觉属性被引入到图像识别领域中,视觉属性在高层语义和底层特征之间架起了一座语义桥梁。本文围绕视觉属性在图像分类识别、检索中的若干关键问题及其应用进行了如下研究: (1)介绍了图像视觉属性概念,分析了其与底层特征以及类别的区别与联系。详细介绍了四种经典基于属性的学习算法:独立属性算法(包括直接属性法、间接属性法)、相关属性算法、相对属性算法以及弱属性算法,并指出这四种算法之间的紧密联系,分析了它们各自的优势和不足。同时,综合了相关、相对属性学习算法的优点,提出了相关、相对属性相结合的属性学习算法,并进行了相关比较实验。 (2)介绍了属性的一般生成方法,详细阐述了提出的基于机器挖掘和人工标注相结合的属性生成过程,该方法保证了所生成的属性兼顾了分类意义上的分辨性和语义意义上的可命名性。同时,介绍了基于属性依赖的遗传约简机制,通过该机制确保所产生属性的充要性。 (3)提出了基于稀疏表示的属性学习模型,该方法将底层特征的稀疏表示和具有高层语义的属性学习相结合,它不像传统分类模型直接利用特征进行分类,而是使用属性集作为中间媒介层,通过属性的识别,将较为复杂的图像识别、检索问题转化为相对成熟的文本识别、检索问题。同时,所采用的稀疏表示方式为视觉数据的降维和属性快速判定提供了可能,削减了最终类别映射的时间开销。文章通过理论分析和实验比较,分析了属性学习法与非属性学习法,直接属性预测法与间接属性预测法,稀疏表示法与非稀疏表示法的特性,并通过基于Android系统的花卉识别应用系统设计进一步验证了所提方法的优点。 (4)提出了基于稀疏表示的零样本迁移属性学习模型,方法通过属性知识的迁移学习,在没有待识类别训练样本的情况下,首先利用可见训练类别样本进行属性分类器学习,再利用训练好的属性分类器对待识样本的属性进行识别,最后利用属性-类别映射关系进行待识样本类别判定。在Oxford17数据库上的实验验证了该算法的有效性。 (5)介绍了稀疏编码表示的一般理论,在此基础上提出了基于局部保持的可判别字典编码表示方法,并将此用于属性分类器的设计。该方法在普通稀疏字典编码表示模型基础上引入局部保持和可判别约束,确保了相似的样本数据其编码表示也相似,从而优化了各类别的编码表示字典。同时,所采用的Fisher准则确保了编码表示特征能够满足类内离散度小、类间离散度大的判别特性。在花卉数据库上属性分类实验中验证了该算法的有效性。