论文部分内容阅读
随着互联网和传感器技术的迅速发展,人们获取的数据从过去的单一视图描述逐渐演变为无处不在的多视图描述。因此,多视图学习成为人工智能、机器学习等领域的研究热点。多视图聚类分析作为多视图学习任务的一个主要研究方向,在过去的几十年里发展迅速,取得了长足的进展。其中,基于图学习的多视图聚类因其简单、高效而受到人们的广泛关注。然而,受不同视图之间的异构信息及实际数据中可能存在的噪声影响,已有基于图学习的多视图聚类方法从多个视图或多个图中直接学习一致的图,难以准确的刻画所有视图的结构,从而降低了聚类的稳定性和正确性。对此问题,论文分别从图输入和样本输入入手,深入研究鲁棒图学习的多视图聚类算法。具体内容如下:
针对基于Markov的多视图聚类方法忽略了目标秩先验信息,处理含有光照变化等噪声数据时聚类性能退化明显问题,提出了融合局部和全局图的多视图聚类方法。该方法使用最小化部分奇异值之和代替核范数,有效地将目标秩的先验信息嵌入到一致图学习模型中。另外,使用每个视图构建的局部图和所有视图串联的特征构建的全局图做输入,明确考虑了多视图数据的局部几何结构和全局几何结构。在人脸、数字、视频图像等八个标准数据集,以及人造数据集上的实验结果表明,该方法显著提高了多视图聚类性能。
针对直接使用原始数据构建的图做字典学习相似度描述难以准确刻画数据的本质结构问题,提出了基于图潜在子空间学习的多视图聚类方法。该方法将每个视图构建的图线性转换到共享子空间,同时,在得到的潜在图子空间描述上使用流形学习自适应学习潜在相似度描述。最后,将潜在图子空间学习、流形学习和谱聚类融合到统一的框架中,有效地挖掘多视图数据的互补信息以及潜在描述的局部几何结构和聚类结构。在此基础上,给出了有效优化算法,在物体、数字、文本和场景等五个数据集上进行了实验仿真,实验结果证实了所提方法的优越性。
针对基于子空间学习的多视图聚类方法忽略了潜在描述的局部结构和邻域关系,难以准确刻画数据的本质几何结构问题,提出了基于潜在相似度学习的多视图聚类方法。该方法将原始多视图数据线性转换到低维共享的子空间中,同时在得到的潜在描述上使用流形学习自适应学习共享相似度矩阵,从而挖掘了潜在描述的局部结构和邻域关系。该方法得到的潜在描述具有较好的低秩结构,避免了求解核范数最小化问题,有效降低了计算复杂度。最后,将潜在描述、流形学习和聚类融合到统一的框架中。自适应学习的潜在描述和潜在相似度矩阵能够较好的刻画数据的本质结构和类别结构。在常用的物体、数字、场景和癌症景观等五个数据集上的实验结果表明,所提方法显著提高了聚类性能,同时缩短了运行时间,并且对参数不敏感,提升了算法的适用性。
针对基于张量核范数的多视图聚类方法忽略了不同奇异值的重要性差异这一先验信息,导致对含有光照等噪声数据的聚类性能退化比较明显问题,研究了基于张量奇异值分解的加权张量核范数,将奇异值的贡献度差异信息嵌入到基于张量奇异值分解的张量核范数中,给出了加权张量核范数最小化模型及有效优化算法。理论分析表明已有的张量核范数最小化模型是所提模型的特例。然后,将加权张量核范数应用到多视图子空间聚类,联合谱聚类,提出了基于加权张量核范数的多视图聚类方法。该方法有效地挖掘了多视图数据的高阶相关信息和互补信息,提高了在实际应用中的灵活性和稳定性。在常用的人脸、物体、数字和场景等五个常用数据集上进行了实验仿真,实验结果证明了所提方法的有效性。
针对基于Markov的多视图聚类方法忽略了目标秩先验信息,处理含有光照变化等噪声数据时聚类性能退化明显问题,提出了融合局部和全局图的多视图聚类方法。该方法使用最小化部分奇异值之和代替核范数,有效地将目标秩的先验信息嵌入到一致图学习模型中。另外,使用每个视图构建的局部图和所有视图串联的特征构建的全局图做输入,明确考虑了多视图数据的局部几何结构和全局几何结构。在人脸、数字、视频图像等八个标准数据集,以及人造数据集上的实验结果表明,该方法显著提高了多视图聚类性能。
针对直接使用原始数据构建的图做字典学习相似度描述难以准确刻画数据的本质结构问题,提出了基于图潜在子空间学习的多视图聚类方法。该方法将每个视图构建的图线性转换到共享子空间,同时,在得到的潜在图子空间描述上使用流形学习自适应学习潜在相似度描述。最后,将潜在图子空间学习、流形学习和谱聚类融合到统一的框架中,有效地挖掘多视图数据的互补信息以及潜在描述的局部几何结构和聚类结构。在此基础上,给出了有效优化算法,在物体、数字、文本和场景等五个数据集上进行了实验仿真,实验结果证实了所提方法的优越性。
针对基于子空间学习的多视图聚类方法忽略了潜在描述的局部结构和邻域关系,难以准确刻画数据的本质几何结构问题,提出了基于潜在相似度学习的多视图聚类方法。该方法将原始多视图数据线性转换到低维共享的子空间中,同时在得到的潜在描述上使用流形学习自适应学习共享相似度矩阵,从而挖掘了潜在描述的局部结构和邻域关系。该方法得到的潜在描述具有较好的低秩结构,避免了求解核范数最小化问题,有效降低了计算复杂度。最后,将潜在描述、流形学习和聚类融合到统一的框架中。自适应学习的潜在描述和潜在相似度矩阵能够较好的刻画数据的本质结构和类别结构。在常用的物体、数字、场景和癌症景观等五个数据集上的实验结果表明,所提方法显著提高了聚类性能,同时缩短了运行时间,并且对参数不敏感,提升了算法的适用性。
针对基于张量核范数的多视图聚类方法忽略了不同奇异值的重要性差异这一先验信息,导致对含有光照等噪声数据的聚类性能退化比较明显问题,研究了基于张量奇异值分解的加权张量核范数,将奇异值的贡献度差异信息嵌入到基于张量奇异值分解的张量核范数中,给出了加权张量核范数最小化模型及有效优化算法。理论分析表明已有的张量核范数最小化模型是所提模型的特例。然后,将加权张量核范数应用到多视图子空间聚类,联合谱聚类,提出了基于加权张量核范数的多视图聚类方法。该方法有效地挖掘了多视图数据的高阶相关信息和互补信息,提高了在实际应用中的灵活性和稳定性。在常用的人脸、物体、数字和场景等五个常用数据集上进行了实验仿真,实验结果证明了所提方法的有效性。