论文部分内容阅读
随着统计技术在自然语言处理领域的兴起,在语料规模有限的情况下,参数平滑作为解决数据稀疏问题的主要方法显得十分重要。本文分析了几种常用参数平滑算法的优劣,在英语词性标注中比较了这几种算法的平滑效果,实验表明:在语料规模有限的情况下,线性插值和Katz’s回退平滑较优。本文通过在相同环境下对各算法的平滑效果的研究和实验,旨在为人家提供一个选择平滑算法的借鉴。