论文部分内容阅读
近年来,图像分类技术对于很多人群的图像处理需求有着十分重要的作用。图像分类技术即利用计算机网络自动的对各种纷繁的图像进行分类,在科研、商业以及日常生活中都具有十分广阔的应用价值。生理学家的研究发现,人类的视觉系统中对于信号的处理是一种对视觉信息的层级的抽象稀疏的过程,其中涉及一个很重要的过程——稀疏编码。通过对人类视觉神经系统的模仿,稀疏编码在被引入到图像分类技术之中,以此发展的图像分类技术有着越来越重要的影响。本文研究学习了一个经典图像分类模型——线性空间金字塔匹配模型以及其在图像分类中的实际效果,这是一种有监督的图像分类技术,主要涉及图像的输入、特征提取、编码、池化以及最后的图像分类部分,并在图像分类问题中有着较为显著的优势。为了利用图像中显著特征是稀疏的性质以及相近特征要具有相似表达的特点,本文在此模型基础上加入了一种非负的约束,采用了一种改进的基于稀疏编码的图像分类算法来求解这种改进的模型。这种稀疏优化算法是采用一种基于循环框架下的非凸的稀疏编码算法,其特点是通过利用已求解的信息循环迭代去寻求更优解。将这种优化算法应用在场景分类的问题中,数值实验发现,这种新的算法在图像分类问题上有着较好的分类效果,在具体的测试数据集中有着较高分类准确率,在同类算法中,其准确率都十分的有竞争力。以此技术为基础,又在纸币识别问题中做了一些探索性的工作,验证了图像分类技术的一些关键性结论,如字典在稀疏表达的重要性,正则参数对准确率的影响等,也证明了这个方法在纸币这类特殊图像的识别问题中也有很大的潜力。