中文复杂句语义角色标注

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:zhaojifeng177
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在自然语言理解领域中,语义角色标注是为句子中谓词论元及附属成分标上其担任的语义角色,如施事、受事、时间和地点等等,是获取语义信息的一种重要手段。对句子谓语动词的论元及附属成分分派语义角色,可以得到句子的浅层语义结构。本文研究内容主要是填补了现有的中文语义角色标注系统中对双动词复杂句式进行语义角色标注部分的空白,使该系统对任何中文句式都能够进行有效的语义角色标注。在中文中,含有两个或两个以上动词的复杂句占所有句子的比重超过四分之一,而目前确没有比较满意的中文剖析器,可以对这类中文子句进行完整句法树分析。对主谓词及其相关论元结构的错误识别,会很大的恶化语义角色标注系统的最终性能。而在中文处理中,并没有其它方法可以很好的解决这个问题。为此本文进行了针对性研究,提出一种基于完整句法分析不可获得的情况下,仅用浅层POS标注信息提取的特征进行句子的论元结构分析,从而得出句子的组块信息。然后用规则的方法进行语义角色标注。该方法提出的句式分类比以往的句式分类标准更加严谨更加合理,通过对比试验,句式分类的正确率比以往有了明显的提高。由于所采用的分类方法是以更好的映射语义角色为原则,语义角色标注性能也有了很大的提高,同时该方法还弥补了整个语义角色标注系统对某些特殊句式无法识别的缺陷,改善了整个语义角色标注系统的性能。
其他文献
全球石油资源的日益枯竭和化石燃料燃烧带来的日益严重的环境污染问题迫使人们开始大力发展新能源汽车。增程式电动汽车作为传统内燃汽车与纯电动汽车的过渡车型,既能实现传
随着信息技术的快速发展,信息数据大量出现在日常生活中。如何高效地从这些信息数据中获取到有用的知识,显得日益重要。在传统机器学习研究过程中,往往需要假设测试数据与训
在科学技术飞速发展的信息时代,光电技术、信息技术和集成电路技术在各个领域的作用越来越显著。而在光电技术领域,光纤通信和光纤传感技术作为新的激光应用技术,已经成为工