论文部分内容阅读
随着互联网的高速发展及广泛应用,数字图像大量地出现在人们的生活中。面对海量的图像资源,如何准确、高效地实现图像的分类、检索、标注等各项工作,已经成为当前智能信息处理研究的热点。词袋模型是分类算法中应用比较广泛中的一种,并在图像分类中表现出优良的性能,所以获得了广泛的研究与应用。视觉词典是词袋模型的基础,构建更具有描述性的视觉词典不仅能提高图像的分类准确度,还能减少算法计算时间。如何获得更具有代表性的视觉词典,以便更好地对图像进行描述已经成为提高分类准确度一个关键的步骤。本文以构建具有较高辨识度的视觉词典为目标,研究视觉词典的优化方法,将优化的视觉词典应用到图像分类中,以提高图像分类的准确度。围绕上述内容,本文研究内容主要体现在如下两个方面:第一,在传统词袋模型和现有香农熵的基础上,首先对两者存在的问题进行分析;然后针对存在的问题对其进行改进,以便筛选出辨识度高的视觉词典。首先将训练集按类别聚类;然后利用改进的香农熵计算每个类中每个视觉单词的香农熵值,删除香农熵值大的视觉单词,也就是每个类中辨识度低的视觉单词;最后将优化后的每个类的视觉词典放到一起得到优化后的词典。实验结果表明,新方法可以选择出更具有代表性的单词,提高分类结果。第二,分析了传统互信息进行单词选择过程中存在的问题,对传统的互信息进行了改进,并将其应用到视觉单词选择中,筛选出辨识度高的视觉单词。该方法对互信息进行单词选择的影响因素和不足进行了综合分析,更有利于选取就有代表性的视觉单词。本文针对传统词袋模型视觉词典构建中存在的问题,在已有的香农熵和互信息的基础上对其分别进行改进,将改进后的香农熵和互信息应用到单词选择中,筛选辨识度高的视觉单词。本文将构建的富有判别力的视觉词典应用到图像分类中,提高了图像分类的分类准确度,并且可改善计算速度。