候选区域感知的嵌套命名实体识别方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:lwh849453
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
命名实体识别(Named entity recognition,NER)任务旨在从非结构化的文本数据中定位并分类出预定义的实体类型(如人名、地名和组织机构名称等)。命名实体识别是自然语言处理中的一项基础任务,许多下游任务依赖于其结果,如知识图谱构建、实体关系抽取、实体链接以及问答系统等。由于自然语言表达的多样性,现实语料中经常会出现实体嵌套的场景。然而,大部分现有的命名实体识别相关研究工作均忽略了该场景,从而无法充分挖掘文本中的实体信息,进而影响下游任务的性能表现。本研究针对命名实体识别任务中的实体嵌套问题提出了候选区域感知的嵌套命名实体识别模型(Candidate region aware model,CRAM)。为了减轻现有工作中存在的类别不平衡问题和提高模型效率,本文提出的方法将嵌套命名实体识别任务分解为两个子任务:实体词序列标注任务和候选区域分类任务。对应两个子任务,本研究分别设计了两个模块,实体词序列标注模块标注输入文本中每个词是否为实体词,以过滤掉部分与实体类别不相关的文本区域。候选区域分类模块则根据实体词序列标注模块的结果选出更可能为实体的候选区域,并将各个候选区域分类到对应的实体类别或分类为非实体类别。考虑到两个模块之间的依赖和联系,本研究应用多任务学习的方法将两个模块进行联合训练,两个模块共享部分参数,从而能在一定程度上捕捉模块之间的依赖和联系信息,有助于提升模型的整体性能。为了验证本文提出的模型的有效性,本研究在公开数据集上进行了详细的实验验证和分析。实验结果表明本文提出的CRAM模型能有效减轻现有工作中存在的类别不平衡问题,从而取得更好的性能表现。同时,在相同的实验环境下,本文提出的CRAM模型相对其他基于神经网络的嵌套命名实体识别模型所需要的训练时间更短。
其他文献
交替方向乘子法(ADMM)对于求解带有两块变量线性约束优化问题来说,是一种行之有效的方法,在统计学、信息等领域有着很强的应用.但是直接将此方法推广到多块变量的情况时,若无适当假设,算法不一定收敛.由于该算法在相关领域的重要应用价值,近几年关于多块ADMM算法的研究呈增长趋势.其中何炳生等人提出的逐块ADMM算法是一种很好的方法,该方法首先将多块变量分成两组,在求解子问题时,组与组之间采用Gauss
摘要:随着机器人运动控制技术的快速发展,医疗机器人功能特性不断地进行完善并成功应用到临床实践中。医疗机器人具有的精确定位、力度控制和高分辨感测能力特性能够有效协助
当前,机器人被广泛应用于恶劣环境下的抢险救灾任务,如森林救火、地震救援等。在这些特殊环境下,机器人能协助人类完成危险任务,从而减少人员伤亡。然而,传统的轮式机器人和履带机器人,由于其运动方式的局限性,不适合在复杂环境下工作。仿人机器人具有支撑域小、灵敏度高的优点,在该环境下工作有一定的优势,因此,对仿人机器人的研究具有重要意义。而髋关节与骨盆的设计方法和运动过程影响着仿人机器人行走的稳定性。因此,
云计算服务的灵活性和拓展性为用户提供便捷的同时,也使得虚拟计算环境中隐私数据的安全性成为了当前云计算领域的热点研究问题。主要包含两个方面:一是在虚拟计算环境中,用户和企业放在云上的隐私数据可能会被黑客窃取;二是虚拟机监控器作为硬件和客户机的桥梁,它自身存在的漏洞一旦被黑客挖掘出来并加以利用,那么其上层的隐私数据将被黑客控制,造成重大损失。针对上述问题,基于虚拟计算环境的隐私数据访问监控系统对隐私数
水下图像增强在海洋生物检测和捕捞等实际应用中起着重要的作用。水下图像往往会受到低能见度、低对比度、颜色失真等问题的影响。在处理以上降质问题时,无模型的图像增强方
具备强制访问控制的数据库中存在的隐蔽通道是一种非法的通信途径,严重威胁了信息安全。隐蔽通道分析的核心问题是隐蔽通道的标识,现有的隐蔽通道标识的方法主要有共享资源矩阵法、语义信息流法、无干扰分析法、隐蔽流树法等。隐蔽流树法能够明确地给出隐蔽通道中的操作序列,更有助于隐蔽通道的场景描述,但是目前的做法是手工生成共享资源矩阵,研究共享资源矩阵的辅助自动生成工具对于提高隐通道标识的准确度和效率具有重要意义
石油气历来有工业的粮食之称,足以见得石油气在现代工业发展中所占据的重要地位,随着海上油气资源的进一步发掘,海洋立管作为连接海底井口与海上平台之间的重要连接设备,其产
随着物联网技术的发展和无线传输技术的进步,越来越多的物联网产品应用于工业生产和社会生活之中。目前关于物联网无线技术应用的大多数研究仅限于一种或几种无线技术的应用,
RV减速器作为工业机器人领域的新兴精密减速器,具有体积小、精度高、结构紧凑、传动比范围大等特点,是工业机器人的一种核心零部件。随着国内工业机器人的发展,工业机器人所
随着我国商业银行在数量上不断增长、竞争不断加剧,“以市场为导向、以客户为中心”的经营理念开始为各家商业银行所普遍接受并实行。这表明外部服务的重要性已经被越来越多的专家学者以及企业管理者们所认知,然而实践表明,上述人群对于内部服务的重视程度尚不足够。抛开模式化的产品制作与柜面服务不谈,商业银行给予外部顾客的定制化、差异化服务主要来自“客户经理”这一群体,因为这一群体是联系商业银行与外部客户的重要桥梁