论文部分内容阅读
特征集约减在Web中文文本分类中具有重要的作用。等距特征映射(Isomap)方法是流形学习理论中一种广泛应用的无监督非线性降雏方法。本文根据Web中文文本训练集中已有的类别信息提出了一种有监督的Isomap算法,该算法通过引入一个类别参数,调整类别之间的测地距离,并运用一种简便的方法将测试集嵌入到低雏空问。实验结果表明,该算法可以进行可视化,直观地获取文本数据的结构信息,并且在较低的维数上保持较好的分类效果。