论文部分内容阅读
由于短文本的内容短小,文本包含的有效信息很少,因此在文本分类中特征空间的维数通常高达为几万,大大降低了文本挖掘的运行速度,占用较大的内存空间.针对这一特点,本文提出了一种基于改进的模拟退火算法的特征选择方法.在该方法中,增加了记忆功能,避免遗失搜索过程中的最优解;设计了常系数温度更新函数、状态产生函数.实验结果证明该方法是有效的.