论文部分内容阅读
随着数字媒体技术和计算机网络的不断发展,数字图像资源迅猛增加,如何有效地管理与检索如此巨大的资源,就成为学术界亟待解决的问题。从20世纪90年代初起,基于内容的图像检索技术(CBIR)逐步取代原来的基于文本的图像检索技术(TBIR),成为多媒体技术研究的热点之一。但图像低层特征和高层语义之间的“语义鸿沟”严重限制了CBIR的发展,因此研究人员逐渐将关注回归到语义,使得以图像自动标注为基础的基于语义的图像检索技术(SBIR)越来越受到重视。本文在深入理解和分析图像语义检索最新研究进展的基础上,创新地提出了用于图像内容表示的RoI-BoW模型,以及基于多层分割内容表示的图像多标签自动标注模型(MLSIA)。RoI-BoW模型在BoW模型的基础上进行了改进,该模型考虑到兴趣区域对于图像检索的重要性,通过关键点的检测与过滤生成兴趣区域,并采用不同的方式对兴趣区域和非兴趣区域分别进行图像内容表示,最后将两个部分按照一定的比例相结合,成为最终的图像内容表示。本文利用基于RoI-BoW模型的图像内容表示方法对图像进行检索,并与基于BoW模型的图像内容表示方法进行了检索性能的对比,实验结果证明基于RoI-BoW模型的图像检索算法能够得到更加准确的图像检索结果。基于多层分割内容表示的图像多标签自动标注模型(MLSIA),其创新点在于采用多层分割图像内容表示方法,以及利用二阶条件随机场对图像进行自动标注。MLSIA首先采用多层分割图像内容表示方法,将显著性分析与多种分割算法相结合,对图像进行多层次的分割,并利用基于区域的“词袋”模型进行图像内容表示;接下来,MLSIA将图像内容的表示和图像的语义标签相结合,训练二阶条件随机场模型,并运用该模型对图像进行多标签自动标注。本文利用MLSIA对三个不同图像数据集进行了图像多标签标注的实验,并与其他标注模型进行了对比,实验结果证明,MLSIA在图像多标签标注上能够得到较好的查全率和准确率,且优于同类算法。