论文部分内容阅读
随着“全民造图”时代的到来,使得让计算机自动给图像进行标注成为越来越迫切的需求,作为图像分类的重要研究内容,场景分类识别得到了广泛关注,是目前计算机视觉领域的研究热点和难点。场景分类在许多方面有着重要应用,比如基于内容的图像检索、目标识别、智能视频监控系统、数码冲印、移动机器人等。经过几十年的发展,研究者们在场景分类问题上取得了令人鼓舞的成果,但由于场景分类问题较大的类内差异性和较小的类间距离,使得其仍是一个极具挑战性的研究课题。本文针对场景分类识别问题,重点研究了提取场景图像的充分有效特征、场景图像表示的降维方法和分类器的参数优化算法,本文的主要工作主要有:首先,研究了提取场景图像的充分有效特征的方法。首先分析了场景图像分类的难点所在,在此基础上,总结了现有的场景分类方法,分析了各类场景分类方法的优缺点,进一步分析了目前场景分类正确率遇到瓶颈的原因。突破传统的基于人工设计特征的思路,本文使用单层SAE网络在不使用先验知识的情况下提取场景图像的充分有效特征。随机从场景图像中获取大量图像块,进行预处理操作之后的图像块对单层SAE网络进行训练,确定SAE模型的结构和参数。将图像卷积特征提取引入到了场景图像表示的过程,通过图像卷积构造局部连接的单层SAE网络完成图像表示。与现有的特征提取方法相比,SAE模型不需要构建“码书”,以相对较小的计算量为分类器提供充分有效特征。其次,对场景图像表示的降维方法进行了研究。由SAE网络得到的图像表示维数十分庞大,将会导致分类器产生过拟合问题。本文提出一种基于均值池化操作的图像表示降维方法,将图像表示从高维空间映射到低维空间的同时实现去噪。均值池化本质上是一种均值滤波技术,能有效降维和去噪,得到场景图像的特征向量。再次,对多分类SVM分类器的参数优化方法进行了研究。重点研究了基于PSO的SVM参数优化方法,引入PCA算法,提取特征向量的主要信息,使特征向量进一步降维,提高SVM参数优化过程的效率。最后,对本文的场景分类方法在有关数据库上进行仿真研究,实验结果表明,本方法取得分类正确率高于目前已有方法,并能够有效解决颜色恒常性问题。