论文部分内容阅读
语义角色的句法实现就是要研究句法与语义接口问题或者说是是深层的语义格如何映射为表层的句法成分的问题。我们将相对于主体、客体而言,角色地位的核心度不高的凭借类语义角色和情景类语义角色称为非核心语义角色,凭借类语义角色包括工具、材料、方式、原因、目的五类,情景类语义角色包括时间、处所、范围、方向、同源、数量和基准七类。本文首先通过相关软件抽取出《中小学语文课本标注语料库》中含有非核心语义角色成分的句子生成《凭借类例句语料库》和《情景类例句语料库》,在例句语料库的基础上人工筛选出凭借类和情景类的非核心论元块的核心词和与之相搭配的动核,以相同的句法语义格式为分类标准,分别对论元块的核心词和与之相配的动核打上义类标记,由此形成包含5个子库的《凭借类词汇语义制约信息库》和包含7个子库的《情景类词汇语义制约信息库》,对语料库进行数据统计和分析,考察情景类语义角色和凭借类语义角色不同的词汇语义对句法位置的依赖程度,得出具体的义类优先度不等式并总结其特点。论文共分五章,各章节的内容分别如下:第一章绪论。梳理与本文相关的理论基础和研究现状。简介本文的研究目的、研究方法、创新点、意义。第二章语料库的建设。首先,我们以《中小学语文课本标注语料库》为母库,利用抽取软件生成5个子库的《凭借类例句语料库》和7个子库的《情景类例句语料库》,然后根据本文具体需要人工抽取所有非核心成分的名核和动核,用相关软件并结合人工操作打上义类标记,建成《凭借类词汇语义制约信息库》和《情景类词汇语义制约信息库》。第三章主要对凭借类语义角色(工具、材料、方式、原因、目的)分别从句法配位、句法填位和语义角色句法实现的词汇语义制约特点上进行阐释。第四章主要对情景类语义角色(时间、处所、方向、范围、同源、数量、基准)分别从句法配位、句法填位和语义角色句法实现的词汇语义制约特点上进行阐释。第五章总结。从数据分析中,宏观总结非核心成分的主要特征。本文的创新之处在于:补充和完善了语义角色句法实现的词汇语义制约相关的信息库,为中文信息处理提供更全面和系统的知识库,并为今后自动语义角色标注提供语料支持。