论文部分内容阅读
随着计算机视觉的发展,图像处理任务的要求越来越高,对高精度的图像标记的研究越来越重要。图像标记是给图像的每个像素点或图像块进行类别标记,所以可以看做是分类问题的一个子问题。统计机器学习方法是假设样本数据满足独立同分布,而实际情况中的样本不满足独立同分布时就会带来统计的偏差,造成预测的损失。针对这些复杂的且彼此之间存在相互依赖关系的结构性数据,结构化学习方法是一种较好的可解决此类数据问题的学习方法。马尔科夫随机场(Markov Random Fields,MRFs)和条件随机场(ConditionRandom Fields,CRFs)被用于表示不同事件的相互关系,是标记和学习结构化数据的概率模型,它们的广泛应用也掀起了结构化学习的热潮。 结构化支持向量机是一种较好的处理结构化数据的学习方法,通过对随机场模型参数的学习来得到结构化预测结果,但是在样本数量较大的非线性分类情况下,核函数的计算带来内存消耗的增大和计算量的增加。而本文在结构化支持向量机的基础上提出一种基于Boosting算法的结构化学习方法,通过组合多个弱分类器得到非线性分类的效果,并且Boosting在学习过程中可以通过弱分类器对不相关的特征做选择,这样也使模型更为简单。 本文对结构化学习方法展开了系统的研究,本文的主要工作如下: 首先通过对传统机器学习分类器算法的介绍,指出统计学习方法在实际复杂图像标记问题中的不足,也为之后支持向量机(Support Vector Machine,SVM)和AdaBoost的结构化改造提供了理论依据。然后介绍了用来表示结构化数据的马尔科夫随机场模型,并对其参数学习、模型推理等细节展开描述。 其次对结构化支持向量机深入研究,并将其用于学习MRFs模型参数中,同时介绍了本文求解能量最小化问题的图割法。针对结构化支持向量机在非线性分类中存在的问题,本文提出一种基于Boosting的结构化学习方法。 最后在三个不同的数据集上对本文提出的方法进行验证,同时与统计机器学习方法中的支持向量机和AdaBoost,及结构化支持向量机进行了比较,实验结果验证了本文提出的基于Boosting的结构化学习算法在图像标记中的可行性和有效性。