论文部分内容阅读
词义消歧是自然语言处理中的一项基础任务.本文针对先秦古汉语这一特殊的语言材料,将WSD的过程分为先区分拼音后区分具体词义这两个步骤.实验过程使用了《汉语大词典2.0》为知识来源,《左传》为语料,采用了基于支持向量机(SVM)的半指导方法.本文同时做了直接为全体词义分类的对比实验,结果证明"分两步走"的标注过程确实更充分的利用了词汇的语言学信息,达到的效果也更好。