论文部分内容阅读
图像目标识别是图像理解和计算机视觉领域的热点问题之一,在军用、商用、民用等诸多场合均有着广泛的应用前景。基于核方法的模式分析技术是近年来性能较好、理论上较为完善的一种模式识别新技术,已经初步应用于图像目标识别。本文从研究图像目标识别的特殊性出发,针对识别过程中二维图像信息输入和多类判决问题,从核函数的构造和核函数的应用两个角度开展了一些研究。在核函数的构造方面,论文首先在分析传统基于核函数的图像模式识别方法的基础上,研究了计算图像相异性的度量方法,并使用此度量取代经典高斯核函数中的矢量距离,提出能直接以二维图像数据为输入量的图像核函数。此图像核函数以经典高斯核为原型,在用法上,与定义在矢量空间的经典核函数保持高度兼容性,在功能上,综合考虑了图像的能量信息、亮度信息、位置信息以及结构内容信息,能更为全面地衡量两幅图像之间的关系。然后从提高图像核函数识别过程的可靠性出发,提出冗余分块图像核函数。将图像核定义过程中子块的无覆盖顺序分块方式,改为有覆盖的冗余分块方式,通过增加冗余子块的附加信息,减少对目标结构信息丢失的概率。最后从减少数据约束、提高核函数的实用性出发,减少识别过程中图像核对目标位置、姿态的严格要求,提出离散分块图像核函数。在分块方式上,使用感兴趣区域(ROI)技术来选择离散分块的候选块,并提出基于线性回归假设检验和基于Hu不变矩的两种点集位置匹配模型来对两图像中离散块的位置集合进行相似性评估,评估结果作为权值的一部分参与到图像核函数的计算过程中。图像中仅有信息量较大的部分子块参与运算,对应子块的位置是通过局部搜索得到,故离散分块图像核函数可以应用于存在平移、旋转、尺度等变化、以及少量遮挡的目标。对COIL图像目标数据库的实验验证了上述结论。在核函数的应用方面,论文研究了基于支撑向量域描述(SVDD)的可拒识多类分类器技术。首先在研究核函数参数变化对SVDD最小超球的影响程度的基础上,提出推广能力测度的概念,此测度能够更准确地描述样本与各类别之间的隶属关系,可以用来取代经典SVDD中使用的距离测度作为类别判决标准。然后针对计算推广能力测度时的特殊性,提出具有多层结构的SVDD识别算法。此算法在识别策略上迥异于当前以“最佳划分”为目标的统计模式识别算法,以“认识”事物而不是“区分”事物为目的。该算法除了在两类分类能力和多类分类能力上均具有良好表现外,还从原理上具有对未知类别数据进行拒判的能力。