论文部分内容阅读
本文尝试利用基于变换的方法标注中文句子词汇的句法功能。系统输入已分词并标注了词性的句子,输出每个词的依存关系。我们首先设计了一个由44种依存关系组成的汉语依存体系,然后以人机互助的方式标注了1300句中文句子。其中1100句作为训练文本用来获取标注规则,余下200句用做测试。设计了17类变换模板,采用基于变换的算法获取了60条有序的依存关系标注规则。在测试时,对新词标注以该词词性所对应的最高频的依存关系作为初始标注以提高鲁棒性。实验表明这种方法简单可行,取得了初步满意的效果。