论文部分内容阅读
近年来,互联网的飞速发展和数码相机、电脑及智能手机等工具的普及使用,导致图像信息爆炸式增长,如何对这些图像进行分类也便成为了一个亟待解决的问题。像自然场景这样较复杂的图像,传统的监督学习框架已经不能满足所需要求,学者们又相继提出了多示例学习框架、多标记学习框架和多示例多标记(MIML)学习框架。本文主要是将多示例多标记学习框架应用到自然场景图像的分类中,展开了对多示例多标记学习算法的研究学习,并针对基于RBF神经网络的MIML算法进行了改进,本文的主要工作如下:(1)MIML学习算法处理的是包含多个示例的包,包生成方法的好坏直接影响到最终的分类结果。本文研究并实现了基于固定区域和基于图像分割的两类包生成方法,通过实验证明,在自然场景图像分类中,SBN(Single Blob with Neighbors)包生成方法效果较好。(2)针对自然场景图像分类,研究并实现了MIMLBOOST、MIMLSVM、M3MIML和MIML-KNN等算法:MIMLBOOST和MIMLSVM是基于退化策略的,它们假设示例间或标签间是相互独立的,损失了很多的有用信息;而M3MIML和MIML-KNN则考虑了示例和标签的相关性信息。通过实验表明,考虑了相关性信息的M3MIML和MIML-KNN算法在分类效果上要优于未考虑相关性信息的MIMLBOOST和MIMLSVM算法。(3)基于神经网络对MIML展开了进一步研究,主要分析了基于RBF神经网络的MIML算法,并针对该算法进行改进——为平均Hausdorff距离引入一个自动调节系数。通过实验表明:①针对自然场景图像分类的MIML算法中,基于RBF网络的算法要优于基于BP网络,也优于其他传统算法;②在最大Hausdorff、最小Hausdorff、平均Hausdorff和三种Hausdorff距离均值这四种度量方式中,采用平均Hausdorff距离的分类效果最好;③针对平均Hausdorff距离削弱了两包之间最近示例距离所起作用的问题,改进之后的平均Hausdorff距离可以进一步提高分类的精度。