论文部分内容阅读
提出了一种结合关键词特征和共现词对特征的向量空间模型.首先,通过分词和去除停用词提取文本中的候选关键词,利用文本频率筛选关键词特征.然后,基于获得的关键词特征两两构造候选共现词对,定义支持度和置信度筛选共现词对特征.最后,结合关键词特征和共现词对特征构建向量空间模型.文本分类实验结果表明,提出的模型具有更强的文本分类能力.