论文部分内容阅读
随着计算机技术与移动互联网的快速发展,大量的图像信息每天以不同的方式产生并以数字的形式被上传到互联网上,这使得图像成为目前互联网时代中人们传递信息的重要手段。面对日益繁多的图像资源,如何方便快捷地组织和精准地检索目标图像显得迫在眉睫。图像自动标注是当前图像处理领域中的研究热点,其目的是为图像分配若干能描述其图像视觉内容的标签(关键词),它是当前以文本为基础的图像检索过程中一个关键性的步骤。图像自动标注在十多年的发展历程中,取得了丰硕的研究成果,不但其精度在持续提高,而且标注模型也在不断完善。但是由于低层视觉特征与高层语义之间存在语义鸿沟的制约,使得图像自动标注的标注性能和标注效率仍然有待提升。本文在学习探索现有标注方法的基础上,以提高图像自动标注性能和标注效率为出发点,结合机器学习中的稀疏编码技术和字典学习方法的高效性,提出基于Fisher字典学习的图像自动标注方法和基于判别字典学习的图像自动标注方法。具体工作内容如下:(1)首先简单介绍了图像自动标注的研究近况、当前研究中存在的难点与不足。然后介绍了与图像自动标注研究过程相关的基本理论知识。(2)针对数据集中标签分布的不平衡性、图像不同类型特征的有效组合后的纬度问题,提出了一种结合核空间映射的Fisher判别字典学习图像自动标注方法。本方法在高斯核函数的作用下将最初的输入数据映射到一个高维的核空间进行判别字典学习。实验结果表明,基于核空间Fisher判别字典学习的图像自动标注方法在改善图像标注性能方面具有一定的有效性和可行性。(3)为了降低语义鸿沟对图像自动标注的影响,提高标注效率,本文结合标签一致性判别字典的高效性提出一种多标签判别字典学习图像自动标注方法。该方法首先在字典学习的输入特征空间中,为每幅图像提取多种类型的特征,然后引入一个训练集标签相关正则化项,将样本之间的标签相关性作为字典学习的部分输入特征数据,最后以得到的判别字典和系数矩阵为基础设计相应的标签预测算法来实现未知图像的语义标注。最终实验数据表明,使用这种方法可以较好地效提升标注准确度和标注性能。