论文部分内容阅读
互联网的高速发展使得通过网络传输的文件监控和过滤成为一个热门课题。使用传统的基于字符串匹配的算法显然无法满足呈几何爆炸级别的信息增长的监管需求。而使用SVM确实可以提高分类效率,但依然存在维数过大导致存储资源和计算能力浪费的现象。为了有效减少SVM的维数,提出通过使用特征简约对向量机的维数进行约束的一个一类SVM算法改进。实验表明:在选用相同数量的特征词的前提下,改进算法使得不良信息分类和过滤的正确率有明显提高。