【摘 要】
:
零形式是指句子中隐式的、未显示表达的语义成分,是传统语义角色标注不能标注出的语义角色,也不是谓词依存成分的语义角色。零形式被区分为有定的零形式和无定的零形式,其中,
论文部分内容阅读
零形式是指句子中隐式的、未显示表达的语义成分,是传统语义角色标注不能标注出的语义角色,也不是谓词依存成分的语义角色。零形式被区分为有定的零形式和无定的零形式,其中,有些被忽略的语义成分能够在语篇中的句法成分之间建立起特定的语义联系,为保证语义的完整性,需要从上下文中为该缺失的语义成分找到所指的先行语,这种情况就被称为有定的零形式;而当被忽略的语义成分不影响人们对篇章完整意思的理解时,不需要从上下文中找回其先行语,这种情况就称之为无定的零形式。由于零形式的出现,语篇上下文的某些联系就被忽略了,因此,发现并找到隐式表达的语义角色,并将其与上下文语境中的先行语进行连接,可以更深层地理解篇章语义。本文基于汉语框架语义,针对汉语篇章零形式识别与填充任务,将其分为零形式识别、零形式分类和有定零形式填充三个子任务,并研究了实现每个子任务的具体技术方法。主要研究内容及成果如下:(1)针对零形式自动识别任务,进行了两级识别,首先对已有的规则方法稍作改进来进行零形式的第一级检测,然后利用统计出的标注模式过滤去除掉部分错误识别的零形式。(2)针对零形式分类问题,即对于自动识别出的零形式,判断其中哪些属于有定零形式,本文选取了最优特征集,建立最大熵分类模型,并通过实验对比验证了该方法的有效性。(3)针对有定零形式自动填充任务,首先将该任务看成指代消解的二分类问题,选取了词层面及框架层面的8类特征,建立最大熵模型;此外,本文研究了 FrameNet中的框架关系,提出了一种基于框架关系的零形式填充算法。最终,在结合两种方法时获得了最优的填充效果。本文研究了零形式识别及有定零形式填充方法,并在构建的语料上进行了实验,进一步阐释了本文方法的有效性,为实现更深层次的语义分析提供了一种新思路。
其他文献
随着信息技术的不断发展与在企业中应用的不断扩大,数据库做为数据存储与管理的软件系统,其作用越来越被从业人员所重视,伴随而来的是数据库管理与性能调整、监控问题。数据
随着新兴电子商务平台广泛使用,用户在享受便利的同时,也通过论坛发表关于产品的观点。通过这些评论,普通用户可以了解产品的性能,为购买行为做出理性的选择,生产者可以快速
图像信号在产生、传输和记录过程中,经常会受到各种噪声的干扰,这破坏了图像的视觉效果,严重影响了边缘检测、图像分割等后续处理的进行。因此,采用适当的方法减少噪声(即对
近年来,随着各种应用需求的不断增长,数据融合技术作为一门新兴交叉学科得到飞速发展和广泛关注。各种传感器、信息源所获得的大量数据均希望通过数据融合系统相互互补,以获
在自然语言处理领域,语义推理研究是一个非常重要的研究课题。虽然目前的语义研究尚且不够成熟,但语义推理研究对于深入分析文本语义,使计算机更加智能具有深刻的意义。本文
在电信行业,其客户数据的增长速度越来越快,为了提高其决策效率,人们已将数据挖掘中的聚类分析技术引入电信业的客户关系管理中。在数据挖掘中,大部分对象的类属性和归属关系没有严格要求和限制,这些对象数据的属性存有重复叠加性、和交错性,这种特点比较适合进行模糊划分,而且现实生活中许多客观事物之间又具有模糊性,便产生了模糊聚类分析。将模糊聚类应用于各个领域成为了一个研究热点。本文对课题研究主要有以下几个方面
伴随着网络技术的发展,许多应用需要迁移到网络环境的异构平台上,这对新一代的软件开发提出了新的需求。中间件(Middleware)正是应这个需求而被提出,成为研究的热点。
消息
MicroRNA(MiRNA)是RNA家族中的一员,被称为小分子RNA。目前,众多的研究表明,miRNA与生物体的基因表达、生长发育和行为等都有十分密切的关系。早期对miRNA的识别均采用生物学
汉语基本块识别是汉语语块分析体系中的基础任务之一,属于浅层句法分析的一个环节。对给定的汉语句子,汉语基本块识别任务将形式化为以字为基本标注单位的序列标注问题。基于