论文部分内容阅读
数字图像每天都以惊人的速度产生和发布。图像中含有的信息往往比文本更加丰富,在人们的日常生活中起着至关重要的作用。因此,如何更加有效的组织、管理大型图像数据库,并且能从中检索出符合用户要求的图像。是当前图像检索领域的研究热点。目前图像检索系统主要有两种类型:关键词索引的检索模型和视觉内容索引的检索模型。前者利用图像的标注信息实现检索功能,但因人类个体差异性而无法实现一副图像的统一标注及人工标注代价高昂等弊端,使该检索方案的发展遭遇严重的瓶颈;后者利用图像本身的视觉特征信息实现检索功能,该模型广泛应用于众多领域,但由于底层视觉特征与高层语义之间无法逾越的鸿沟严重阻碍了该方法的发展。研究者们提出了多种结合方案用以发挥两种不同模型优势的同时也避免他们的劣势,这些工作都使图像检索的性能得到了显著提高。本文围绕图像检索,对以自动标注替代人工标注的问题、图像特征表示的问题以及如何融合文本信息与视觉信息的问题进行了研究,具体研究成果如下:(1)现存的图像自动标注技术往往需要将图像分割为若干具有独立语义的图像块,然后比较图像块间的相似度并为待标注图像分配相应的关键词。由于日常生活中的图像种类繁多,有些图像(场景图像)包含的语义内容比较单一,在对这类图像标注关键词时,分割不仅会增加工作量而且可能会因分割过度而引入噪声标注。因此,本文根据待标记图像的复杂度在图像特征提取时采用不同的提取机制,并结合贝叶斯分类算法实现图像的自动标注。(2)传统的基于内容的图像检索方法只考虑了图像的内容特征而忽略了环绕文本的信息。本文针对这一问题提出了分两阶段进行图像检索的方法:首先,根据图像环绕文本的语义信息进行第一阶段的检索,通过该阶段的检索过滤掉一些相关性小的图像,保留相关性大的图像并组成图像库;其次,在该优化了的图像库上根据图像的视觉特征进行第二阶段的检索,并将检索结果作为最终结果返回给用户。检索过程中应用Word Net和IC算法分析、度量环绕文本的语义信息,并采用典型相关分析方法学习不同图像特征间的关系。(3)传统的基于KNN的图像自动标注系统在对图像标注时,将与待标记图像内容最相似的图像的标签作为标记结果,没有考虑图像的高层语义信息。本文研究了一种优化方法来对图像标注的结果进行优化,在标注过程中首先根据KNN算法选出与待标注图像内容最为相似的近邻集合,并根据近邻集合中的位置关系为每幅图像赋予不同的权值;采用Word Net及相关技术为待标注图像筛选出基本关键词集和扩展关键词集。该方法同时考虑到与图像内容相关的关键词也考虑到与图像语义相关的关键词,实验结果表明,标注结果也得到了较好的优化。