【摘 要】
:
语义分析是自然语言理解的根本性问题,也是研究的重大难题。语义角色标注(Semantic Role Labeling,SRL)是语义分析的一种简化形式,因具有定义清晰、评测容易等特点而成为目前
论文部分内容阅读
语义分析是自然语言理解的根本性问题,也是研究的重大难题。语义角色标注(Semantic Role Labeling,SRL)是语义分析的一种简化形式,因具有定义清晰、评测容易等特点而成为目前的研究热点。目前主流的语义角色标注研究都是基于短语结构句法分析,并取得一定的成功。自动句法分析性能对基于短语结构句法分析的语义角色标注性能起着主导作用,是现阶段语义角色标注的瓶颈。而另一方面,基于依存的句法分析由于其自身的特点日趋成为研究的热点。因此,本文从依存分析出发,实现了基于依存分析的语义角色标注,研究内容主要包括以下几个方面:首先,探索了谓词的自动识别和谓词词义识别。由于语义角色标注是以谓词为驱动,这使得谓词自动标注是语义角色标注面向实际应用的前提。本文实现了基于机器学习方法的谓词识别和谓词词义识别。实验表明,在CoNLL2008测试集上谓词识别和谓词词义消歧的性能F1值分别达到了89.9%和82.1%,是目前已报告的在相同数据集上取得的最好性能。其次,研究了基于依存分析的语义角色标注。将语义角色标注分为以下三步实现:剪枝、角色识别和角色分类。重点探索和分析了剪枝策略、特征选择对系统性能的影响。同时,分析了自动依存句法分析和自动谓词标注对语义角色标注性能的影响。使用CoNLL2008的数据集,基于自动依存树和自动谓词标注,取得的语义角色标注性能F1值为80.94%,与CoNLL2008评测的最优性能相当。最后,首次尝试和探索了基于依存分析的中文语义角色标注。在将英文语义角色标注方法移植于中文时,重点分析了中文的语言特点,探索有利于中文语义角色标注的特征集,取得了较好的性能。作为基于中文语料的初次探索,为以后的研究打下了基础。
其他文献
运动目标跟踪方法的研究和应用是计算机视觉的一个重要分支,现日益广泛应用于科学技术、国防建设、医药卫生以及国民经济的各个领域,有着不可估量的发展前景。由于被跟踪目标
在互联网飞速发展的时代,传统专家系统的局限使得基于Web的专家系统开始被研究和应用,这是专家系统必然的发展方向,但是现有的基于Web的专家系统的开发却面临缺乏相应的合适
软件定义网络(software defined network)通过控制面和转发面的分离解耦,为动态配置网络和控制网络提供了丰富的可编程性,是近年来发展势头十分强劲的一种新兴网络架构。而传
与传统的车辆检测器相比,基于视频图像处理与视觉技术的车辆检测器具有处理速度快、安装维护便捷且费用较低、可监视范围广、可获取更多种类的交通参数等诸多优点,因而近年来
P2P技术日益成熟、网络带宽不断增加和终端系统服务能力的逐渐加强,端系统的服务能力占总体服务能力的重要一部分。近年来,这些资源如何得到充分利用,并在面向Internet的大规
随着虚拟现实和3D可视化仿真技术的发展,物理仿真开始广泛应用在电影,动画,游戏,计算机辅助设计,甚至军事模拟等领域。物理仿真引擎用于快速开发可视化物理仿真系统。在可视
落叶松根系为树形分枝结构,主要由初生根、次生根、初生根一次侧根、次生根一次侧根组成。各级根系之间具有明显的自相似性,本文基于L-系统理论构建落叶松根系生长模拟模型,
随着Internet的高速发展,各种形式的新型应用层出不穷。特别是以Web2.0为代表的新一代互联网应用,给传统的数据存储模式带来了极大的挑战。以往的Internet服务几乎都基于Clie
随着计算机与信息技术的发展,人们在日常事务处理和科学研究中积累了大量数据。如何从中提取或“挖掘”用户所需要的信息,是当前信息科学技术领域面临的一大挑战。数据挖掘正
随着网络储存服务的高速发展,众多的企业和个人已经把大量的数据交付第三方服务器储存,怎样保证私有数据的隐私成为急需解决的难题之一。绝大多数现有的加密体制虽然能够保证