论文部分内容阅读
本文利用文本分类中文本的特点提出了一种基于模糊集的同义词处理的新方法.本方法充分考虑不同文本类型中同义(近义)词之间的差别,在训练中自动计算不同类型文本中特征词对其对应的同义概念的隶属度,从而实现了用模糊集来定义同义概念;然后应用同义概念来提取文本中的特征值.另外,本系统还利用模糊集来处理多义词的问题.文中给出了系统的处理算法.比较试验的结果表明该方法提高了分类的正确率,效果是令人满意的.整个系统达到了较高的自动化水平和较强的可移植性.