语义角色标注中的关键技术研究——多任务学习方法在组块分析中的应用

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:ppmeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在自然语言处理过程中,语义分析是一个不可或缺的阶段。通过语义角色标注,我们可以获取浅层语义信息。所谓浅层语义信息,是与概念深层语义相对而言的。语义角色标注是语法与语义的接口。   语义角色标注任务需要对语料进行一些预处理操作,包括:分词、词性标注、组块分析。其中,组块分析与深层语义信息直接相关,对于语义分析的质量也起着至关重要的作用,已引起研究者的广泛关注。   传统的组块分析系统大多采用单任务学习(Single—task Learning)模式下的统计方法,如Conditional Random Files模型,Support VectorMachine模型,Maximum Entropy Markov模型。它们虽然取得取得了不错的性能,但是我们并不知道哪种模型对于组块分析任务是最佳的模型,哪种特征或特征组合是最为有效的。   多任务学习(Multi—task Learning,MTL)方法能够在一定程度上解决此问题。多任务学习以并行的方式学习多个辅助任务,并用一个共享的结构来刻画这些任务间的共享信息,以此来提升目标任务的性能。   交互结构优化(Alternating Structure OptimizatioN,ASO)算法是最近提出一种线性多任务学习方法。它的有效性在半监督和监督模式下都得到了验证,我们在Chinese Tree:Bank2.0数据集上的实验证明它对于中文数据集同样有效。但是之前这些方法都需要引入大量的外部数据来获得性能的提升。因此,能否在不引入额外资源的前提下,用ASO提升组块分析系统的性能已经成为一个亟待解决的问题。针对这个问题,本文提出了一种以有监督的方式应用ASO的新算法。在Chinese Treebank5.0数据集上的实验证实了此方法的有效性,使错误率减少了5.72%。
其他文献
无线传感器网络综合了传感器技术、嵌入式计算技术、分布式信息处理技术和无线通信技术,能够协作地实时监测、感知和采集各种环境或监测对象的信息,并对其进行处理,传送到所
位置与导航服务是目前最大最热门的信息产业之一。多年前美国就建立了全球卫星定位系统简称GPS(即Global Position System的简称)。目前GPS是整个卫星导航领域中技术和市场最
中医学以整体观和平衡观为指导,建立了独具特色的生命理论和诊疗体系,是现代医学的重要组成部分。中医通过四诊合参、辨证论治来推断病症,诊察病情。而舌诊是中医四诊中望诊中的
当3G浪潮在中国掀起,TD-SCDMA相关产业进行的如火如荼的同时,我们必须看到,作为已经商用多年并在国内拥有将近4亿用户和全国性网络覆盖的第二代移动通信系统,必将在国内继续
当今社会,互联网已成为人们生活中不可或缺的部分,互联网规模越来越大,相关技术也日益复杂。在当今高度复杂的网络环境下,网络上数据传输的安全性和网络的可扩展性是人们高度
随着计算机和通信技术的迅猛发展,数字图像信息作为最重要的信息之一,被愈来愈广泛的使用。但是,原始图像的数据量非常庞大,必须经过有效的压缩,才能满足数字图像高速传输和
网络虚拟化(Network Virtualization,NV)技术在近年的计算机科学和通信领域被广泛关注,它将网络资源以及网络功能组合成单一的基于软件的管理实体,提供了在共享下层网络之上
本研究课题来源于江苏省科技成果转化专项资金项日“基于多网融合技术的TD-SCDMA多模终端的研制及产业化(BA2006101)”。本文的主要任务是在OPNET仿真环境下,基于现有的C3G-A
高温超导薄膜由于其较低的表面电阻和功率损耗而得到越来越广泛的应用。特别是随着高温超导薄膜制备技术的不断提高,使得其在通信电子领域中的应用前景越来越被看好。然而,在微波场中高温超导薄膜表现出的非线性特性大大限制了用高温超导薄膜制造的微波器件的应用。微波表面电阻是非线性研究的一个重要组成部分,对它研究有助于了解非线性产生的原因和其微观本质。因此,高温超导薄膜的微波表面电阻测试研究就显得尤为重要。目前,
低仰角目标角度测量是目前米波雷达技术面临的重要难题之一。米波雷达由于具有反隐身能力而在现代雷达中占有越来越重要的地位。米波雷达之所以在反隐身方面具有优势,是因为米