基于树核函数的命名实体语义关系抽取方法的研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:man168176
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实体间语义关系抽取是自然语言处理中的一个重要问题,不仅是信息抽取的一项主要任务,而且具有广阔的应用前景。核函数的研究和使用是当前机器学习研究领域的热门课题,树核函数作为一种特殊的核函数,已被应用于关系抽取的研究,并取得了一定的成功。树核函数直接计算两个对象(如语法结构树)之间的相似度,从理论上讲,突破了以往基于特征向量的方法,可探索隐含的高维特征空间。本文选取了一种卷积树核函数,实现了一个实体间语义关系抽取的原型系统。在ACE2004语料库上关系检测和7个关系大类抽取的F指数分别取得了72.5和57.4。从实验结果上看,原型系统的性能已经优于某些同类型系统。通过对原型系统的详细分析,我们发现原型系统所能抽取的关系实例不完备。基于此,本文提出对语义关系树进行适当的扩充和裁剪,针对特定的结构采用特定的处理方法,使得系统性能在原型系统的基础上有了大幅度的提高,在ACE2004语料库上关系检测和7个关系大类分类的抽取中,F值提高到79.1和71.9。针对长距离的关系识别性能较低的特殊情况,本文创造性地引入了语篇分析树,提出了把语篇分析树与原有的语义关系树相结合的方法,并针对ACE2004语料库中的关系实例进行了尝试性的实验。虽然实验语料不是很充分,而且受到我们采用的语篇分析器SPADE系统性能的制约,从实验数据来看,本文的方法有效,具有一定可行性的。
其他文献
随着计算机技术和通信技术的飞速发展,用户存储了越来越多、具有很高使用价值的内容,整个互联网内容存储的中心,渐渐从网络核心移向靠近终端用户的边缘。内容存储方式的转变趋势
伴随着信息技术的飞跃发展,计算机应用的不断普及,人们的生产生活已经无法离开这个不可或缺的工具。随之而来的则是计算机和网络所带来的安全问题。计算机和网络的安全问题成
随着P2P和SIP在各自领域技术的不断发展,越来越多的研究机构和组织开始了将SIP和P2P网络技术相结合的研究,以达到使二者优势互补的目的。P2P-SIP系统就是利用P2P技术来实现原
随着我国网民数量的不断增加、“互联网+”概念的提出和网络安全上升为国家战略,网络安全逐渐成为互联网发展的重要组成部分。近期,Heartbleed、Bash漏洞、反射性DDoS攻击等
我国的对虾养殖在水产养殖业中占有非常重要的地位,随着计算机技术,信息技术及网络技术的发展,水产养殖也从最开始的传统养殖方式向着信息化的方向发展,对虾养殖也不例外。当
多处理器片上系统已成为下一代嵌入式系统发展的潮流。由于各FPGA器件生产厂商、开源组织、第三方芯片设计公司已开发了大量经过验证的优秀IP软核。因此,本文重点研究使用IP软
在传统的岩土工程位移测量中,专业测量相机一直是作业设备的主流,但其不但操作复杂,而且成本较高,大大的限制了数字摄影测量在岩土工程中的应用。近年来,随着CCD技术的不断发
由于系统级芯片SoC(System on a chip)具有高效的集成性能,是替代集成电路的主要解决方案,已经成为当前微电子芯片发展的必然趋势。SoC设计规模的不断增大也使得以IP核形式实现
网络信息安全问题越来越受到人们的关注,安全审计技术的研究成为解决这一问题的有效途径之一。安全审计的研究主要集中在对审计采集技术,审计分析技术和体系结构的研究。分布
无线传感器网络常用于在面积巨大或人类不易到达的区域监控周围环境的各种信息,近年来无线传感器网络一直是研究的热点,广阔的应用前景更使其越来越受到工业界的重视。在监控