论文部分内容阅读
图像语义分类是基于语义的图像检索研究领域中一个重要且有挑战性的课题。传统的图像分类技术主要是根据图像视觉特征的相似性来进行图像分类,但是由于图像的底层特征与人类的理解之间存在着很大的差异,图像所包含的语义内容无法用图像的底层特征来准确表述,即在图像的底层视觉特征和图像包含的语义之间存在着“语义鸿沟”。本文以彩色图像为数据源,对图像语义分类中的一些关键技术和主要算法做了深入的研究。本文的工作主要集中在:(1)提出了一种基于图像感兴趣区域(Region Of Interest,ROI)提取算法,该算法主要是在传统分割算法基础上引入了图像复杂度分析,也就是根据图像复杂度的差异采取不同的分割算法,解决了图像的精确分割所带来的问题。图像的区域提取只要求在物体层次表示图像,利用图像的局部特征,来区分图像的内容。通过实验证明,使用该算法可以在减少运算量的同时,保持甚至提高识别率。(2)通过分析纹理图像的特点,发现在实际的纹理识别中,某些类别的纹理特征较为明显,只需要较少参数即可识别,而某些类别的纹理,特征很不明显,需要较多的特征参数作为输入参数才能达到较高的识别率。本文在分析传统纹理特征值提取方法的基础上,采用Tamura纹理特征提取的方法提取纹理特征值,解决了特征值提取效率低的问题。并且纹理性质一般都具有直观的视觉意义,采用该方法,更符合人类对图像的理解。(3)针对神经网络学习收敛速度太慢,不能保证收敛到全局最小点的不足,利用了遗传算法改进神经网络分类性能。提出通过遗传算法改进神经网络,算法中的交叉操作范围很广(随机性的采用个体的多个分量),从而较易保持群体的多样性,并且该算法的选择操作具有针对性,这就保证了种群能够稳定的收敛到最优解。实验结果表明该方法具有较高的正确识别率,且收敛速度较快。(4)分析了语义映射的模型,对语义映射和方法的相关理论进行了描述,并设计了基于遗传算法的神经网络分类器,完成图像底层特征到高层语义特征的映射,实现图像语义的自动获取。最后结合提取后的图像纹理特征值,完成图像感兴趣区域的分类。该系统在Corel图像库上与SIMPLIcity系统进行比较,实验结果表明该系统在检索精度等方面有所提高。