论文部分内容阅读
子空间分割对联合子域分布输入样本进行潜在流形聚类,是数据挖掘领域的关键技术之一。谱聚类作为子空间分割算法中应用最为广泛的算法,其性能主要取决于原始输入数据或相应表示系数直接构建得到的关联矩阵。在基于平滑聚类算法和强制组效应的条件下,本文提出一种新的模型用于联合样本系数计算以及相似度矩阵学习,通过对目标函数添加明确的低秩Laplacian约束以获得清晰的块对角结构。称为块对角Lalacian正则约束的平滑聚类算法(Smooth Clustering with Block-diagonal constrained Laplacian regularizer,SCBL)。此外,为了提升该算法准确性,本文还提出一种新的低秩表示聚类算法(Low-Rank Representation,LRR)型数据表示聚类法(Data Representation Clustering,DRC),该算法在无噪声环境中具备明确的对角关联矩阵结构。DRC通过自适应相似度学习构建关联矩阵,并将之融入统一的低秩表示框架。同时,通过对关联矩阵对应的Laplacian矩阵添加一种新的秩约束,使得其相似度连接结构与簇目标数具有一致性。 针对常见的低秩表示算法都采用独立的步骤进行表示系数计算和关联矩阵学习而导致无法保证总体算法的最优性这一问题。算法均通过采用交替更新法对模型进行求解,以保证目标函数单变量优化的全局最优性以及整体收敛性。通过人工合成数据和8个公开数据集的实验结果表明,SCBL算法及DRC算法在聚类精度、归一化互信息、参数敏感性等指标上都具有优秀的性能。