中文命名实体识别及其关系抽取研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:zhihong0223
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究了中文命名实体识别及其关系抽取,设计和实现了一个能识别和抽取人名、地名和机构名的系统CNEE,并通过SRV算法实现了个人主页中的人名和E-mail 的抽取。CNEE 先进行自动分词和词性标注,然后根据人名、地名和机构名的各自特点来进行识别和抽取。自动分词和词性标注的准确率将会直接影响命名实体的识别。本文改进了词性标注,在HMM 标注的基础上引入负反馈规则来进行修正,改进后的词性标注准确率在96%。实验表明CNEE 抽取人名、地名和机构名的F 指数均达到了75%以上。SRV 算法是一个基于规则学习的关系抽取算法,具有训练样本少和准确率高的优点。本文将SRV 算法用于个人主页中的人名和Email 的抽取,取得了较好的效果。实验证明SRV 算法用于命名实体关系的抽取是成功和有效的。
其他文献
本文研究的人力资源信息管理系统是一个旨在为军队职能部门完成人力资源信息的维护、查询、修改和综合统计的系统。设计目标是能够真正实现实时、交互式的管理方式,满足e化管理的需要,提高工作效率和管理自动化程度,节约人力资源管理的时间和成本。 在应用研究方面,本文主要从军队人力资源管理信息化的意义出发,以军队职能部门人力资源信息管理为应用对象,结合当前人力资源管理的实际,提出了建立基于Web Serv
激光三维扫描技术能够快速,精确,无接触地完成复杂物体表面的重构。这一技术正以其独特的优势被广泛地应用于CAD逆向工程,计算机视觉,模式识别,三维动画,虚拟现实,数字医疗,计算机游
随着科技进步和Internet的飞速发展,计算机网络已经覆盖了社会政治、经济、文化、生产的各个领域。用于保护用户网络信息安全的网络安全研究也越来越成为了全社会关注的焦点,并
Web Services是基于Internet进行分布式计算的基本元素,面向Service的计算将成为未来计算技术发展的趋势。一些传统的服务,例如购物,银行交易,商品贸易等都可在Internet上由W
本文对网格环境下多数据源并发控制与协同查询的实现进行了研究。文章首先在分析网格技术、协同技术和数据库技术的基础上,确定了系统的设计目标,给出了系统总体架构。其次,将数
  目前国内外特别是国内,对工作流技术的研究重点主要集中在对工作流系统的体系结构、过程模型、系统互连等方面,而对工作流引擎的讨论所见不多。工作流引擎作为工作流技术的
信息技术改变了企业传统的运作方式,在过去的十年间,大量的工作流管理技术被应用于企业实际运作。如Staffware、IBM MQSeries和COSA等工作流管理系统为企业流程管理提供了强有
缓冲区溢出攻击是相当普遍并对系统具有致命威胁的一种攻击手段。它危害性大,隐蔽性强,堆溢出是缓冲区溢出最常用的手段之一。应用程序本身代码的不完善是缓冲区溢出的根源,而编
随着网络应用的迅猛发展,网络的安全问题也显得越来越突出。传统的网络入侵检测技术的局限性越来越明显,已经不能适应网络新攻击层出不穷和数据量日益增大的趋势。数据挖掘能
两条曲线间的重合检测是求交算法中的一个重要环节,同时也是提高求交算法稳定性的关键步骤之一。低次(如3,4,5次)Bézier曲线在计算机辅助几何设计(CAGD)中有着的广泛应用。在实