论文部分内容阅读
通过分析文本的特征,提出了一种基于稀疏约束非负矩阵分解(NMFsC)的文本聚类新方法.该方法用NMFSC分解词-文本矩阵来降低特征空间的维度,并依照稀疏约束更好地控制稀疏度,然后利用簇中文本的相似性进一步细化簇.实验表明,与基于k-means的文本聚类方法和基于NMF的文本聚类方法相比,此方法具有较高的归一化互信息值(NMI),从而具有良好的聚类性能.