论文部分内容阅读
文本分类是获取文本信息的重要一步,现有的分类方法主要是基于统计理论和机器学习的,其中著名的有Bayes、KNN、SVM、神经网络等方法。实验证明这些方法对英文分类都表现出较好的准确性和稳定性。对于中文文本分类,涉及对文本进行分词的工作。但是中文分词本身又是一件困难的事情∞。论文尝试一种基于字符串核函数的支持矢量机方法来避开分词对中文文本分类,实验表明此方法表现出较好的分类性能。