论文部分内容阅读
非负矩阵分解是近年来一种新颖的降维范式,能够帮助人们从高维复杂的数据样本中挖掘和提取核心特征和信息。在模式识别,多媒体数据分析,信号处理,计算机视觉,文本挖掘等方面都可以看到非负矩阵分解的应用。在图像数据特征分析上,由于非负性带来的纯加性性质,非负矩阵分解能够很好地提取图像的局部特征,构造一种局部组成整体的抽象,十分符合人类的直觉视觉感知。随着非负矩阵分解研究的进展,许多加速和优化分解的算法被提出,而且越来越多的基于它的衍生分解范式也受到许多研究者的关注。而由于非负矩阵分解本身潜在的聚类表征,研究者发现了它与传统的谱聚类、Kernel K-means聚类之间的联系,随后便出现了许多基于非负矩阵分解的聚类算法。这些新的分解范式和算法不但拓宽了非负矩阵分解的应用范畴,而且提高了其在无监督聚类上的性能表现。本文的第一个工作是在分解模糊聚类算法框架的基础之上,利用一种非单调加速邻近梯度方法,来解决分解模糊聚类中出现的约束最小二乘问题,提出了一个加速分解模糊聚类的算法。同时,本文还提出了一个有效的贪婪算法,用于解决在应用非单调加速邻近梯度法时,定义域指示函数的邻近映射问题。本文的第二个工作是提出了一种全新的基于非负矩阵分解的分解范式及其求解算法Fuzzy Cluster-NMF。Fuzzy Cluster-NMF在Cluster-NMF基础上,对于非负矩阵分解中的系数矩阵施加更加严格的约束条件,并且将基矩阵与系数矩阵绑定,从而在目标函数中消除了基矩阵自由度,最终使得分解因子获得聚类中心与隶属度的表征。本文不但给出了Fuzzy Cluster-NMF的目标函数梯度分析,并且利用线性搜索步长的nmAPG算法来加速求解Fuzzy Cluster-NMF的收敛速度。通过对比的数值实验,本文验证了加速分解模糊聚类和Fuzzy Cluster-NMF的聚类效果。加速分解模糊聚类在保证了原聚类准确度的同时显著地提高了收敛速度,而Fuzzy Cluster-NMF不但具有相对更高的聚类准确度,并且同样具有很高的鲁棒性。