论文部分内容阅读
文本分类是中文信息处理的重要研究领域.给文本分配一个或多个不同的类别,可提高文本检索和存储的处理效率.粗糙集是一种不需要任何先验信息的分类方法,通过对文本分词、过滤掉停用词之后把剩余的词语作为特征项,然后把文本用向量空间模型表示出来,将文本集转化成不带决策属性的信息系统,用粗糙集理论中核心内容属性约简实现对文本的分类.实验表明,该方法的查准率和查全率都有所提高.