论文部分内容阅读
鞋印图像是犯罪现场的重要证物之一,对大量鞋印图像进行自动分类管理可以提高案件侦破效率。现有的针对鞋印图像的聚类算法都集中在单标签聚类问题上,但是鞋印图像库存在类别间差异较小的情况,而磨损和残缺等因素更模糊了类别之间的差别,即没有明显的隔离带将不同类别很明显的分隔开;同时,一幅鞋印图像往往包含了一种或多种不同类型的花纹图案,所以存在不同鞋印图像包含相同类型花纹的情况,因此,一幅鞋印图像可以根据其所含有花纹图像的种类划分到不同的类别。本文在分析鞋印图像特点的基础上,提出了鞋印图像多标签聚类算法。主要工作如下:1)提出了基于改进模糊C-均值聚类算法的鞋印图像多标签聚类算法本算法改进了模糊C-均值聚类算法中的隶属度矩阵,在考虑图像与聚类中心关系的同时,考虑图像与图像之间的关系,提出了适应于鞋印图像的多标签聚类算法。算法从高密度点开始聚类,利用改进后的隶属度矩阵确定图像与类别间的关系,实现鞋印图像多标签聚类。本算法在实际的鞋印数据集上的F-measure值达到了 79.09%。2)提出了基于随机游走的鞋印图像多标签聚类算法算法首次将随机游走的思想运用到对鞋印图像相似度矩阵的优化中,首先从每幅图像开始聚类,然后进行类别的合并,最后对多标签图像再标记,实现鞋印图像多标签聚类,本算法既考虑了图像之间的关系,也考虑了类别之间的关系。本算法在实际的鞋印数据集上的F-measure值达到了 78.34%。3)提出了基于概率潜语义分析的鞋印图像多标签聚类算法本算法应用概率潜语义分析模型对鞋印图像基元语义词汇表进行学习,得到图像与潜在主题之间的概率分布矩阵,建立图像之间的关系,经过单标签聚类和多标签聚类两个过程,实现了鞋印图像数据库的多标签聚类。本算法在实际的鞋印数据集上的F-measure值达到了 73.61%。