论文部分内容阅读
伴随数字影像技术、数据存储和互联网技术的迅速发展,图像的数量快速增长,如何有效的管理和组织图像、视频等多媒体数据成为大众日益关注的问题。然而利用图像低层视觉特征的相似性进行匹配和检索的基于内容的图像检索系统已经无法满足用户的需求,它并不能有效的减弱图像低层视觉特征和高层语义之间的语义鸿沟。因此,这推动了基于语义的图像检索系统的产生和研究。为了克服人工标注耗时费力和人对图像理解的不一致性,图像自动标注得到大量研究。图像自动标注是利用图像低层特征表达图像的语义内容,是实现图像语义检索的基础。 围绕图像自动标注中的两个核心问题:图像低层视觉特征的提取和低层视觉特征到高层语义空间的映射模型的选择,本文研究工作如下: 1.结合多媒体内容描述接口(MPEG-7)和MM混合模型实现图像低层视觉特征到高层语义空间的映射。算法中采用MPEG-7标准推荐的颜色描述子和纹理描述子提取图像的低层视觉特征,利用MM混合模型建立低层视觉特征到高层语义空间之间的映射,有效的为图像自动添加上多个语义标签。 2.利用统计分布选择最优的加权特征子集,简称为特征加权。其核心思想是利用根据MPEG-7描述子提取到的特征向量统计分布的离散程度来衡量特征对于不同主题图像的重要程度,使特征在不同的主题图像中得到不同的权重。该算法把特征权重与图像的主题关联起来,每个主题图像都有各自的特征权重集合。 3.采用基于局部加权的决策融合算法:局部决策融合,来融合待标注图像在颜色和纹理模型下得到的标注结果。局部决策融合算法中,根据颜色和纹理特征对每个关键词的标注能力,对颜色和纹理模型下的关键词赋予相应的可信度而不是对该模型赋予相应的可信度。该算法把模型的可信度与关键词结合起来,在同一模型下得到的关键词概率会被不同的加权。 通过在corel图像数据集上的实验,表明了本文采用的算法削弱了低层视觉特征和语义空间之间的语义鸿沟,有效的实现了图像自动标注,且采用的特征加权和局部决策融合方式能更充分利用图像颜色和纹理特征对不同主题图像的区分和表达能力,提高了图像标注性能。