论文部分内容阅读
随着计算机的普及,移动智能设备的流行,人们在日常生活中越来越多的接触和使用到海量的图像。由于计算机不能直接从图像中获得图像语义,所以在图像特征和语义之间存在着语义鸿沟,计算机不能由图像的二维数据而理解图像的内容。本文从考虑点与点相互关系,重点考虑线条的识别,来进行图像的语义分类。本文先简要介绍课题背景,以及目前图像识别中特征提取和语义识别常用的算法。简要介绍了常用的图像语义中的特征描述方法,包括全局和局部特征,以及语义映射的算法。由于本文后面的算法涉及到Canny边缘检测算法,以及受到句法模式识别的启发,所以做了一下这两个方面的相关知识。其中边缘检测算法用来对图像进行预处理达到简化数据和识别难度的目的。当前大多数图像语义识别算法都是基于统计模式识别的,而句法模式识别是非基于数学统计的模式识别方法,句法结构模式识别中提出的基元结构思想的方法给了我们思考问题的另外一种途径。首先提出的一种图像语义识别算法:基于线条识别的方法。基于线条识别的方法是识别图像中轮廓线条的方法。为了简化数据首先利用Canny边缘检测算法将灰度图像转换为二值线条轮廓,然后提出一种方法从图像中识别具有不同特征(不同线条长度和曲率变化率)的线条,并根据线条线长和曲率变化率的分布范围,来对不同类别的待测目标物体图像进行不同语义的图像分类。最后通过实验证实了本文算法的有效性,实验在仅需要少量样本的情况下,就获得了较高的识别率。然后介绍基于模块结构识别的方法,适用于有清晰结构、有限基元的图像,如文字图像。先要根据样本图像定义基元模块,结构模块,然后在待测图像中寻找和分离出不同的基元模块,并得到和样本模块的相似度。两种方法既有联系,又各有不同。相同的是两种方法都是提取图像的线条信息。不同是第一种方法适用于所有图像,但获取的结果没有明确的意义,是基于统计分布来判断相似度。第二种方法只适用于结构明确的图像,获取的结果意义明确。文章最后对这两种方法的适用环境,并介绍了各自的特点,最后说明未来需要完善的方面。