论文部分内容阅读
场景中的目标识别是图像理解中一个主要的研究问题,具有重要的理论研究价值和应用前景。现实世界中由于目标的多变性,如尺度、旋转、光照、位置、遮挡等,复杂混乱视觉场景中目标的识别对于生物学和机器视觉系统来说都是一个比较困难的问题,因此运用生物智能信息处理的方法来指导场景中的目标识别成为当前人们的研究热点。本文通过分析当前神经科学、认知科学等的一些最新的研究成果,在当前已有的比较经典的动物视觉系统模型的基础上,进行了相关的研究。论文研究的主要内容包括:(1)概述了灵长类动物视觉皮质中的层次视觉感知机制,给出了脑科学、生理学、心理学、解剖学、认知学等的当前的一些最新的研究成果,用于支撑本文模型建立的理论基础。(2)分析并实现了当前已有的基于灵长类视觉皮层的动物视觉系统模型,分析了它们各自的识别性能及其适用场合,给出了它们的对比结果,用于支撑本文模型建立的模型基础。(3)侧重分析了HMAX皮层等级处理模型,并通过借鉴SEEMORE模型中多特征组合的思想,在HMAX前馈模型形状特征的基础上加入颜色、纹理等视觉特征,融合各种特征来进行目标感知识别,设计了一种多特征融合前馈目标识别模型。(4)验证了多特征融合前馈目标识别模型在采用SVM、NN、Adaboost三种分类器以及SVM分类器采用不同核函数设置情况下目标识别的性能;验证了多特征融合前馈目标识别模型在Caltech5和GRAZ图像集上的目标识别性能。