汉语框架语义角色的自动标注技术研究

来源 :山西大学 | 被引量 : 21次 | 上传用户:luocaohuozi12345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了给大规模的汉语框架语义资源的构建提供一个自动标注工具,本文基于山西大学自主开发的汉语框架语义知识库(CFN),在给定句子中的一个目标词及目标词所属框架情形下,将其语义角色(框架元素)的自动标注问题通过IOB策略转化为整个句子上的词序列标注问题,使用条件随机场模型(CRF),采用统计学中的正交表实验方案,研究了汉语框架语义角色的自动标注模型。本文的全部实验语料使用的是现有的CFN中选出25个框架的6692个例句。将语料均匀分为4份,分3组作2-fold交叉验证,以3组交叉验证的平均F1-值作为系统性能评价指标。本文给出了系统性能评价指标的方差估计,以及两个标注系统性能差异的显著性检验方法。本文以词为基本标注单元,将标注步骤分为1)边界识别、2)角色分类、3)后处理三个步骤。分别采用了边界识别与角色分类一起进行,以及先边界识别,再角色分类两种标注策略。在后处理步骤上,对输出的标注序列要求在整个句子上满足IOB序列合法性约束,并以所有合法序列中概率最大的序列作为最后的标注输出。本文总共提取了26个特征,对每个特征设定若干可选的窗口,组合构成CRF模型的各种特征模板。为了选出较好的特征模板,本文基于统计学中的正交表给出了一种模板选优方法,并采用三种方案进行了实验。方案一:基于11个词层面特征,其特征包括词、词性、词相对于目标词的位置、目标词等,实验选用正交表L32(49×24);方案二:基于全部的26个特征,包括11个词层面的特征和基本块的句法标记、结构标记等15个特征,选用正交表L54(21×325)。其中基本块特征提取使用的是清华大学周强的自动分析器;方案三:分批正交表实验,即先用正交表L32(49×24),在11个词层面特征选出的最好模板基础上,再加入15个基本块特征,使用正交表L54(21×325),通过适当选择正交表的水平以确保性能不低于前一批实验结果。对每种方案的实验进行了详细分析。本文对正交表模板选优方法与传统的基于贪心算法的方法进行了比较。也比较了本文的基于词序列标注方法和采用完全句法分析树的方法,也对选用不同标注模型,如支持向量机(SVM)模型和最大熵模型的实验结果进行了比较。实验结果表明:(1)在基于11个词层面特征上(方案一),最好结果(平均F1-值)达到61.61%,比基于完全句法分析树,将角色标注看做句法成分的分类问题的结果显著高。与传统的贪心算法特征选择方法比较,本文的正交表模板选择方法与其在标注性能上没有显著差异,但正交表方法的计算更简单,且在通用模板的选择上更适宜。(2)加入15个基本块特征(方案二)可以显著提高标注模型的性能。这类特征主要对角色分类有显著作用,对角色的边界识别作用不显著。(3)分批正交表实验(方案三)比实验方案二在性能上有显著提高。(4)每个框架训练一个模型,边界识别与角色分类一起进行,与先边界识别,再角色分类两个步骤在标注性能上没有显著差别,但由前者得到的标注性能有较小的方差。(5)基于条件随机场标注模型(CRF)与基于支持向量机(SVM)模型的标注结果没有显著差异,但显著好于基于最大熵(ME)模型的标注结果。(6)在全部25个框架的所有实验中,语义角色边界识别最好的结果(平均F1-值)为71.68%;在给定语义角色边界下,角色分类的最好结果(平均精确率)为84.08%;在给定句子中的目标词以及目标词所属的框架情况下,最好结果(平均F1-值)达到63.26%.本文的创新之处主要是首次系统地研究汉语框架语义角色的自动标注模型,给出了一种采用正交表的模板选优方法,在计算上,该方法比基于贪心算法的模板选择方法更简单。对于一般的序列标注中的特征选择问题,本文的正交表特征模板选优法也适用。在标注性能上,本文的结果优于基于句法分析树的语义角色标注的结果。
其他文献
心力衰竭诊断和治疗的进展专辑(二)──老年人心力衰竭的治疗及其问题相川丞等在日本,从国民卫生动向(1992)看,老龄人口(65岁以上),92年是12.6%,预计到2000年将达16.9%。其中因心脏病所致的死亡率,到65~79岁仅次于恶
蛋白质分子功能的重要性与它在蛋白质网络中对应节点的拓扑特性紧密相关。关键蛋白质的识别有助于从系统水平上理解生命活动的内在组织和过程,在疾病诊疗及药物设计等方面有
国家统计局公布了2010年11月份的房地产数据,住宅类房价还是一路上涨,房价"空调"说应运而生。政府一直在调控,房价却一直在上涨,"空调"事实存在,为什么?本文从实证数据着手,分析了
“亲亲相隐”是先秦时期的儒家最早提出的思想主张,随着汉代之后儒家思想成为官方意识形态,经过长期的历史演变,它逐渐成为中国古代刑法中非常重要的原则和制度。作为儒家伦
随着计算机技术的不断发展,三维几何数据已经成为继声音、图象和视频之后的第四代数字多媒体数据类型.数字几何处理就是研究如何在计算机中处理三维几何数据的技术.进入21世
预约虽然未在我国合同法中规定,但不能将其与一般的无名合同相提并论,因为预约并非是对某一典型的交易形态进行法律规范,而是在任何交易形态中均可能存在,是当事人缔约期间对
政府行为之间的博弈之间关系着货币政策的效应,关系着货币政策的效力。因此,探讨我国货币政策与政府行为之间的关系将是很有意义的工作。基于此,本文主要从分析货币政策区域效应
随着大规模测序工具的高速发展,大通量的全基因组得到测序,应用传统的实验方法分析新测序的数据已经远远不能满足当前的要求,而研究基于计算的功能预测方法并揭示这些数据所
中小企业在我国经济发展中的作用现在已为社会各方所关注,作为制约中小企业的发展瓶颈——融资困难,也是目前大家关心的话题。从中小企业融资状况看,造成中小企业融资困难的根本
为了确定体力活动时人体对热环境的温度需求,通过测试和问卷调查的方法进行了冬季实验研究。实验中模拟了2种不同的体力活动。结果表明,在不同环境温度条件下,皮肤温度随代谢