论文部分内容阅读
由于同义词和多义词的存在,使得基于特征词的文本分类方法分类精度不高。近几年,基于概念的文本分类方法得到人们的重视。在此提出一种基于类别核心词的概念映射方法,首先从文本中抽取类别核心词,借助《知网》将特征词映射到基于类别核心词的概念空间,然后在概念空间上完成文本分类工作。实验结果表明,基于类别核心词的概念映射方法及相应的基于概念的文本分类能够有效提高文本分类的精度。