一种改进的特征选择方法在文本分类系统中的应用

来源 :厦门大学学报:自然科学版 | 被引量 : 0次 | 上传用户:yy1986527123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文在介绍文本分类的背景及传统基于向量空间模型特征选择不足之处的同时,提出了不同特征选择方法相结合的文本分类模型。该模型首先对文本进行分析,把文本表示成向量空间的形式。文本在经过预处理后,按一定规则提取关键词,关键词的提取中增加了对名词短语的识别。特征选择的方法上,结合了文档频数和互信息量,并对他们进行了改进。实验结果表明,使用新方法进行分类所得到的分类精度得到了一定的提高。
其他文献
采用自洽场分子轨道UHF/6-31G**从头算法,研究了1,2-C4H6→2-C4H6异构化反应机理,优化了基态势能面上反应物,过渡态,中间体和产物的几何构型,并对各驻点能量进行了零点能校准。结果表明该反应经历了一个1-甲基
微全分析系统在新世纪的一个重要发展方向是应用于分析检测仪器的微型化.目前国外商品化的微流控芯片分析仪价格昂贵,体积较大.国内尚未见到集成化的商品化微流控芯片分析仪.