论文部分内容阅读
随着各行各业对图像的使用越来越广泛,图像信息资源的管理和检索显得日益重要。基于内容的图像检索(CBIR)技术的研究主要包括两个方面:可视化特征提取和相似性度量。其中研究的主体是定义图像的可视化特征表示,通常可视化特征的表示可分为三个级别:图像级别、矢量级别和数字级别。现在大多数可视化特征的表示,诸如颜色、纹理、形状等,均是矢量级别的。因此,相似性度量空间是N维的,计算量相当巨大。 为了能够将可视化对象的级别聚集到最高级别,即数字级别,本文提出应用信息熵作为可视化特征的表示,即用图像的平均自信息量表示图像。这样相似性度量空间的维数就降到一维,从根本上提高检索的速度。本文采用的方法是用颜色直方图作为图像的概率密度函数的定义,再利用该密度函数推导出图像的信息熵。 基于信息熵作为可视化特征表示这一概念,本文提出了两种相似性度量方法:熵差分距离度量和最大相关熵度量。前者是简单的将图像信息熵进行相减,求得差的绝对值,所以计算速度相当快;后者是为了校正相关熵度量没有对称性的缺点而提出的,但此种方法并不能严格遵守可距离度量的条件,因此本文采用熵差分距离度量方法来对信息熵进行相似性度量。 对于两幅十分不相似的图像,其信息熵的值可能相等。所以,单独使用熵差分距离度量方法进行图像检索是不合适的,其精确度不高。为了保证检索算法速度既快,精确度又高,克服熵差分距离度量方法的缺点,本文提出了一个多步检索算法:EDLN算法。该算法先对图像数据库中的图像预先求出其信息熵;检索时,先用熵差分距离度量方法进行快速的粗略检索,得到一个新的图像数据库;最后使用颜色直方图L1-norm算法在这个新的图像数据库进行精确检索,得到最终结果。在EDLN算法的基础上,作者使用VC++6.0开发了一套国旗检索系统,来证明该算法的实用性。 本文的主要内容包括以下几个方面:八硕士学位论文 华吠还y MAs兀R’S TIffSIS l)提出将信息嫡作为图像的一种可视化特征表示,使图像可视化对象的级别山矢量级别聚集到数字级别,也就使相似性度量空间由N维降到一维。 2)提出了两种基于信息嫡的相似性度量方法:嫡差分距离度量和最大相关嫡度量。 3)提出了 EDLN多步检索算法,既保证了检索的速度,又保证了检索的精确度。在此算法基础之上,开发了一套国旗检索系统,提出该算法可以应用到诸如商标、IOgO标识等颜色特征十分显著的图像的检索中去。