论文部分内容阅读
随着网络和计算机技术的飞速发展,数字图像在人们的日常生活中占据着越来越重要的地位,如何高效地分类管理这些数字图像就变得非常有意义。传统的场景分类方法大多使用低层的图像特征,如颜色、纹理等。对于各种视觉识别任务,如目标识别和场景分类,这些鲁棒性的低层图像特征已经被证明是有效的图像表征。但是这些低层的图像特征几乎不包含语义信息,因此对于高层的视觉任务低层的图像表征就显得不是很充分。一种叫做目标库(Object Bank,OB)的高层图像表征包含了高层的语义信息,使其更适合高层的视觉识别任务。本文在研究OB方法的基础上,针对其一些缺陷进行了相应的改进。首先,针对OB方法使用了过高维数的特征向量这一缺点,提出了一种基于Fisher权重的改进方法。高维特征向量的使用大大影响OB方法的分类效率,而使用低维特征向量又会降低其分类的准确率。Fisher权重的改进方法对没有经过空间金字塔处理的OB方法中的低维特征向量加以Fisher权重,使得新得到的特征向量具有极大化类间数据差异并且极小化类内数据差异的性质。从而使其在提高分类准确率的同时,大大提高了分类的效率。其次,针对OB方法对不同物体对于分类的贡献作相同对待的缺点,提出了一种基于类内类间散布权重的改进方法。不同物体对于分类的贡献程度是不尽相同的,类内散布小类间散布大的物体更有利于分类,应该给予较大的权重;反之,则给予较小的权重。结果表明,本文提出的方法有效地提高了分类的性能。再次,提出一种基于高维空间坐标的高层图像表征方法。该方法首先利用K-means聚类算法计算得到不同类别的聚类中心,然后分别计算特征向量与不同聚类中心之间的距离,最后用这些距离替换原来的特征向量来表征图像。新得到的特征向量更直接的表征了其与各个类别之间的关系,从而更有利于分类。实验结果说明,该方法提高了分类的性能。最后,提出一种基于O2C距离的高层图像表征方法。与基于高维空间坐标的高层图像表征方法相比,该方法选取特征向量与不同聚类中心之间的距离的最小值作为O2C距离来表征图像,大大降低了特征向量的维数,从而提高了分类的效率。文章最后对本文方法的优劣行进行了详细的分析。