论文部分内容阅读
聚类分析是一种重要的数据挖掘方法,它能从大量数据中发现潜在知识与规律,广泛应用于模式识别、图像处理、机器视觉等领域。在无人驾驶技术,追踪定位,人脸识别等高新技术应用领域迫切需要对图像数据进行分析与处理。传统的聚类算法往往无法有效的处理高维复杂图像数据,如何有效地解决高维复杂图像数据的聚类分析是一个有挑战性的研究内容,具有重要的理论和应用价值。本论文主要研究高维复杂图像数据的聚类分析问题。结合深度学习特征提取工作,提出了两种深度聚类算法提升图像聚类性能。首先,提出了一种基于深度特征表示的AE-MDPC聚类算法。然后,基于联合特征表示学习和聚类划分的方法,提出了一种嵌入式深度聚类算法(简称DDC)。具体内容如下:1.针对DPC(Clustering by fast search and find of density peaks)算法在处理复杂分布的数据和高维图像数据时聚类性能不佳的问题,提出了一种基于深度特征表示的AEMDPC聚类算法。将基于流形距离的高斯核函数值作为密度值描述了数据点的全局一致性,使潜在类中心的密度值变为局部最大,从而被选为类中心点。自动编码器学到最优特征表示,同时也剔除了属性噪声。AE-MDPC算法提高了密度值的分离度,避免了DPC算法的“多米诺骨牌效应”,AE-MDPC算法在经典人工数据集和真实图像数据集上的聚类性能均优于DPC算法。2.针对AE-MDPC算法分开执行特征提取与聚类分析这一不足,为了进一步提高深度聚类模型的性能,提出了一种深度卷积降噪自编码器结合自注意力机制的嵌入式深度聚类模型DDC,其中深度卷积降噪自编码器从带噪声的数据得到更鲁棒的特征表示,用自注意力机制辅助网络捕获输入图像的局部关键信息。DDC用端到端的联合训练策略调整网络参数得到更适合聚类的特征表示并完成聚类分配。在多个图像数据集上评估DDC聚类方法,实验结果表明DDC算法在实际聚类任务中具有更出色的性能。