论文部分内容阅读
在应用SVM对文本进行分类时,用传统的TFIDF算法对文本特征进行选择会产生高维特征向量问题,这个问题干扰了SVM的效率和准确性,使SVM的性能下降。为了解决SVM文本分类过程中产生的这个问题,提出一种基于本体的特征项约简方法。该方法通过本体找出特征向量中具有同义关系、组成关系和上下位关系的冗余特征项,然后对它们进行合并降低特征向量的维数。试验结果表明,采用本体约简特征向量的方法改进了SVM分类器的性能。