论文部分内容阅读
随着计算机和多媒体技术以及Internet的飞速发展,图像信息也急剧增长,如何从海量的图像数据中高效快速地检索出用户所需图像成为计算机领域的一个重要课题。然而,从图像的视觉特征到图像的语义表达之间存在巨大的“语义鸿沟”,因此有效的图像检索系统必须要解决这个问题,充分利用图像的语义信息。于是基于内容图像检索(Content-based Image Retrieval,CBIR)基础上发展了基于语义的图像检索技术(Semantic-based Image Retrieval,SBIR),SBIR研究如何获取图像语义信息,并根据语义检索相关图像。本文在分析图像的语义模型、图像语义的提取方法存在的问题的基础上,基于本体技术和模糊理论研究了SBIR的几个关键问题,设计和实现了一个基于模糊领域本体语义的图像检索原型系统SBIRFDO。具体工作包括:(1)研究了图像的底层特征(颜色,纹理,形状)提取方法,采用改进的K-均值算法以及颜色和纹理特征进行图像分割,从而提取了图像的感兴趣区域(Region-of-Interest,ROI),并对分割后的区域提取形状和空间位置特征。(2)构建了图像语义的模糊领域本体描述模型(Semantic Feature DescriptionModel using Fuzzy Domain Ontology,SFDMFDO),该模型主要是将本体技术和模糊理论相结合应用来图像特征表示上来,本体是一种用来描述概念以及概念和概念之间关系的模型,而模糊理论能够促使图像检索技术脱离精确的计算。在传统的领域本体基础上,给其中的概念与概念间的关系加入模糊隶属度构成了模糊领域本体(Fuzzy 3Domain Ontology,FDO),用FDO来描述图像语义特征更加符合人类的模糊思维。(3)提出了一种新的基于Vague集的FSVMs语义分类方法(V-FSVMs),并利用它将图像底层特征映射到本体中的高层语义概念特征,这样系统就可以从图像的底层特征自动地获取到图像的高层语义信息。(4)设计了一种基于语义网络和Vague集的相关反馈算法RFSV(RelevanceFeedback based on Semantic web and Vague)。RFSV算法是在传统的相关反馈算法基础上加入真假隶属度函数,能够更加自然地描述图像相应特征在检索中的分量,根据用户的不同理解来更新语义结构,实现图像底层特征映射到本体中的高层语义。(5)设计并实现了一个基于模糊领域本体语义的图像检索原型系统SBIRFDO,并在标准图像库上与基于关键字的语义图像检索方法进行了对比实验。实验结果表明,本文的方法在查询准确度与查全性方面比基于关键字语义图像检索方法都有所改进,并且经过多次反馈以后,系统的性能逐渐改善并趋向稳定。