论文部分内容阅读
当今世界科学技术日新月异,计算机已深入到我们生活的各个领域。随着多媒体技术、网络技术和存储技术的飞速发展,各行各业对图像的使用越来越广泛,图像来源不断扩大,图像数据库的规模也以惊人的速度增长。如何从浩如烟海的图像库中找到所需要的图像信息?这就要求有一种能快速、准确地查找图像的技术,也就是所谓的图像检索技术。传统的图像检索技术,例如基于文本的图像检索已不能完全满足人们的需要。基于内容的检索方式是根据图像自身的视觉特征信息建立索引,然后通过图像相似性匹配,实现图像的检索。许多学者对图像检索进行了更高层次的抽象,即图像的高层语义检索。基于语义的图像检索技术要求计算机按照人的理解来检索图像,但是低层视觉特征有限的表达能力和用户丰富的语义表达存在巨大的差异,即所谓的“语义鸿沟”。如何解决“语义鸿沟”是语义图像检索的关键问题。现在广泛采用的解决方法是建立从图像低层特征到高层语义的映射。而图像的低层特征又包括全局特征和局部特征,为了获取图像的局部特征,需要对图像进行分割,从分割区域中可以得到图像的细节信息,进而提取更高层的语义。基于上述研究思路,本文首先介绍了图像检索技术的研究背景和发展;介绍了基于语义的图像检索的语义层次模型、图像语义的表示和提取,并讨论了SBIR检索中存在的问题。为了提取有效的颜色特征,本文首先进行了色彩量化,并提出了含维变异算子的量子粒子群算法的色彩量化方案。经实验证明,该算法收敛速度快、量化效果好。在色彩量化的基础上,为了提取图像中的高层语义特征,进一步提出了一种基于量子粒子群优化的模糊C-均值聚类的彩色图像分割方法,实验证明该算法具有快速、准确的特点。最后,提取了分割区域的低层特征,依据相似性对图像区域进行聚类,然后计算区域的权值。将图像库中的每一幌图像用一个语义向量进行描述,向量中的每一个分量代表相应的分割区域的权值。对图像库中的图像采用基于量子粒子群优化的模糊C-均值算法进行聚类,以实现基于语义的图像检索。