论文部分内容阅读
本文研究的目的,一方面是要研究基于形状检索的关键问题,如,形状的自动提取、形状的相似形度量、空间关系表示、快速相似检索等;另一方面是希望通过对基于形状检索这一具体问题的解决方法的研究,在视觉信息表示、形状感知模型、感知组织、高维大规模的数据处理等方面做一些有意义的探索。本文的贡献主要包括如下几个方面: (1) 提出了图象特征谱方法。图象特征谱将图象在颜色、纹理、形状、空间布局等方面的特征作为一个统一体表示出来,是MPEG-7规范的一些描述子的实现。图象是特征谱的意义在于为图象内容的表示、获取、及其相似性度量提供了一个一般的思路,基于这一思路,有可能设计出具有一定普遍意义的图象识别和图象理解之类的算法。 (2) 提出了一个基于力场的形状提取方法。我们认为人们对形状的感知是一个局部与全局相互作用的过程,其目标是突现出显著形状。为了模拟这一形状感知过程,我们提出了一个基于力场的形状提取方法:先提取边缘点,将边缘点连接成曲线并用常曲率线段进行拟合,各曲线之间存在着多种相互作用力,曲线本身还有退化力,在这些力的作用下,局部作用与全局优化相结合,经过逐次迭代,次要的曲线将逐渐消失,相互关联的主要曲线将被组装起来,最终突现出显著形状。 (3) 提出了一个新的变形模板匹配方法。对模板匹配方法中的模板结构、能量公式、形变方式等方面进行了研究:以生物体为原型,提出了更为合理的模板结构;简化了模板的内能表达式,及能量梯度的求法;提出了平面形状拟相似的概念,使模板形变具有较好的心理学上的基础。 (4) 提出了基于部分特征的K-近邻相似检索方法。研究了降低相似性计算代价的方法,并以K-近邻相似检索为例,提出了基于部分特征的相似性算法和基于投影的相似性算法,它们通过减少计算距离过程中所涉及的特征数目来提高算法的效率。 (5) 实现了一个基于形状的图象检索系统。我们用图象特征谱方法来自动提取图象中的显著区域,图象的形状由这些区域的边界及其空间关系来描述,由于形状本身的主观性,我们还辅之以基于力场的形状提取方法。用户可以直接勾画一个草图或提交一个示例图象进行检索。我们采取由粗到精的层次化检索方法:先用基于特征的方法检索出一定数量的图象,然后,用变形模板方法,在这个较小的结果子集上进行较为精确的匹配。而基于特征的检索,我们则采用基于部分特征的K-近邻相似检索。