同形词语法功能消歧

被引量 : 0次 | 上传用户:zitayangxin2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动句法分析是当前计算语言学研究的一个热点,同时也是一个难点。由于汉语本身的一些特点,使得汉语自动句法分析的研究更加艰难。我们在做基于功能匹配语法的现代汉语自动句法分析研究时发现,现代汉语同形词存在许多语法功能歧义,给我们的自动句法分析树带来了大量的分支,造成了很大的困难,而这些分支是可以通过单独的处理或者预处理来加以消减的,因此有必要基于句法功能对同形词单独做一下探讨。本研究在工程实践的初始阶段采取一些切实可行的措施对同形词进行处理,减少了句法分析树的分支数量,提高了分析器的速度和质量。本文先对清华973树库中的同形词进行统计分析,从统计结果可以看出,同形词在现代汉语中占有较大的比例,具有很大的作用,因此处理好同形词,对于现代汉语本体研究和自动句法分析研究都有十分重要的意义。由于我们的基于功能匹配语法的现代汉语自动句法分析器只利用从清华973树库中统计出来的词和短语的句法功能,舍弃了词性和词义等信息,因而我们对同形词进行处理时为了和功能匹配的句法分析方法保持一致,就不能像其他大多数研究那样利用词性、词义信息,而是只利用句法功能信息,这样就把我们的消歧策略限定在的一定的范围内。排除词性、词义信息后,可以看到上下文信息也是可以用来消除同形词语法功能歧义的有效信息。在借鉴以往词性、词义消歧研究和小规模实验的基础上,本文决定基于同形词的上下文信息来进行同形词语法功能消歧。本文的消歧策略分为两部分:一是基于同形词的语法搭配来进行消歧,即根据同形词的某个特定上下文搭配信息进行语法功能消歧;二是基于同形词的上下文语境信息来进行消歧,也就是通过计算同形词上下文语境的相似度进行语法功能消歧。这些策略都着眼于大规模语料的统计,语言学角度的分析和描写较少,方法的一致性比较高,大大提高了结果的可信度。本文用汉语中目前研究比较充分的“打”和“花”两个词为例进行消歧实验,把清华973树库作为封闭测试的语料,用1998年1月人民日报语料作为开放测试的语料,基于搭配的“打”和“花”语法功能消歧实验封闭测试的结果分别为80.4%和91.5%,开放测试的结果分别为69.16%和70.00%;基于语境计算的消歧实验的封闭测试的结果分别为93.68%和92.56%,开放测试的结果分别为72.06%和62.50%,二者的实验效果都比较理想。由于基于搭配的消歧方法在抽取某些语法功能搭配时需要人工的干预,用于大规模真实语料时还存在一定的困难,因此进行句法分析时我们可以采用基于语境计算的同形词语法功能消歧策略来进行同形词的前期处理。
其他文献
市场比较法的原理与方法韩立英市场比较法(TheComparativeMethod)是房地产评估中最常用的方法之一,也叫比较法,是指在求取待评估房地产价格时,将待评估房地产与已经发生交易的类似房地产进行比较,通过各
混合式学习在以课堂教学为主的中学教学中的开展,学校可充分利用多种教学资源的优势,不仅可以发挥传统课堂教学的主导作用,更可充分利用现有条件培养学生多种能力,促进信息技
"艺术类学生个性"在理论上和日常管理中已不是新概念,但长期以来,对艺术类学生个性的内涵、特征和成因,学界缺乏理论的思考和系统的研究。从理论上廓清艺术类学生个性的内涵
<正>PXI技术概览PXI(PCI extensions for Instrumentation)不仅是一个总线技术,同时也是一个基于PC技术的模块化I/O的标准,为基于PC的自动化测试测量cn与控制系统架构添加了
飞速发展的电力工业对电能的计量与管理提出了先付费、后用电,低功耗,低成本,高可靠性和高安全性等更高的要求。单相电子式预付费电度表应运而生。论文在对电能计量和数字信
云计算是在网格计算基础上提出的一种新型计算模型,是下一代网络计算平台的核心技术,它提供了可靠安全的数据存储、方便快捷的互联网服务和强大的计算能力。在教育领域,云计
本文收集整理了32篇已公开发表的学术论文的湖泊富营养化有效监测数据约140组,对湖泊氮磷时空特征和富营养化的关系进行分析。结果表明,我国湖泊总氮(TN)和总磷(TP)的变化范
本文研究了不同稀土元素在不同浓度水平下红壤(黄筋泥)中微生物量的变化规律。结果表明,不同稀土元素对土壤微生物量具有相似的影响效应:在低稀土浓度条件下土壤微生物量升高,随稀
社会主义与市场经济兼容是构建社会主义模式不容回避的历史课题,包括空想社会主义与科学社会主义在内的所有社会主义模式大多经历了社会主义与市场抉择的探索。经历近一个世
目的:研究湖南省未经抗反转录病毒治疗的成人和儿童艾滋病毒感染者/艾滋病患者的人免疫缺陷病毒(Human ImmunodeficiencyVirus,HIV)的蛋白酶区和反转录酶区耐药基因变异情况,