论文部分内容阅读
在正向最大匹配法的基础上,提出了一种便于在网络搜索引擎上使用的消除歧义的方法。通过利用单字词和二字词的高频特性以及不同词条的词频特点,再加上长词优先的原则,来消除在分词中可能会出现的交集型歧义和组合型歧义。实验结果表明:改进的回溯算法,比最大正向匹配法和回溯法的消歧更加有效。对高频交集型歧义字段取样分析结果表明,改进的回溯算法正确率达到75%。