基于强化学习与大型语言表示模型的因果关系抽取

来源 :吉林大学 | 被引量 : 0次 | 上传用户:wangyuanshan3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关于因果关系的研究由来已久,但目前自然语言处理领域的因果关系抽取研究仍是一个新兴领域。最初因果关系抽取仅为关系抽取任务中的其中一种,但随着因果关系抽取任务的重要性逐渐显现,目前已有越来越多的研究致力于单一的因果关系抽取任务。作为一个比较新的研究方向,在因果关系抽取任务中,数据集过小是我们在研究中常常遇到的问题,其解决方式一般是使用元学习或数据增强方法。目前的数据增强方法大多数采用一套基于规则的处理方法,本文总结了现有的数据增强方法,并针对其弊端,提出了一个新颖的基于对抗训练的任务自适应数据增强模型。另一方面,在因果关系抽取任务中,隐性因果关系的识别一直是研究中的一大障碍,由于其在不同的语料中的表现形式十分多样,目前很少有研究在隐性因果关系上取得进展。本文提出的自适应对抗模型具有另一个作用,由于本ACMM模型能够根据任务数据的不同,针对性的选择句子中更能表明因果关系的单词进行删除。并且通过实验证明,在具有显式因果连接词的句子中,ACMM模型有更高的概率选择因果连接词进行删除,因此我们认为,在无明显因果连接词的隐性因果关系中,被本模型有较高概率选择的单词或短语更有可能是隐式因果连接词。通过这项研究,可以通过另一个视角来看待隐式因果关系,为后续的隐式因果关系的研究提供参考。在实验上,通过添加本模型的对抗训练,在两个公开数据集上的实验显示,大部分基础模型的效果都有所提升,这证明了本模型的有效性。与不同的删词策略的对比实验显示,本模型产生的策略更优,同时具有更高的稳定性。我们还通过可视化模型的输出这一实验证明了本模型具有一定的识别因果连接词的功能,同时对于隐式因果连接词有一定的判别效果。
其他文献
长期以来,贝叶斯网络(Bayesian Network,BN)是一种被用于在不确定性条件下进行知识表示与推理的流行媒介。贝叶斯网络分类器(Bayesian Network Classifier,BNC)是BN的一种特殊形式,它主要用于解决机器学习领域中的分类问题。在众多BNC中,平均的一阶依赖估计器(Averaged One-dependence Estimators,AODE)不需要进行参数调整
学位
水稻是世界范围内最重要的粮食作物之一,它的产量和质量极大地影响人们的生活。但是水稻易受到稻瘟菌侵染导致稻瘟病,使得水稻大幅减产。由此可见,找到针对稻瘟病的长久且广谱的防治方法十分重要。研究发现,植物真菌病原体的小RNA(small RNA,sRNA)可以跨界调节寄主植物以促进其感染。因此,通过整合稻瘟菌与水稻多组学数据,探索在侵染水稻过程中起重要跨界调控作用的稻瘟菌关键致病sRNA,对于稻瘟病的防
学位
目的 探讨山姜素对博来霉素所致肺纤维化(PF)小鼠的影响及作用机制。方法 60只小鼠随机分为六组:对照组(NS组)、模型组(BLM组)、羧甲基纤维素钠组(CMC组)、低剂量山姜素组(Alp25组)、中剂量山姜素组(Alp50组)、高剂量山姜素组(Alp100组)。采用气管内滴入博来霉素(2U/kg)建立PF小鼠模型,从造模第二天开始治疗,隔天给药1次,共10次。21天后计算小鼠肺系数,测定肺组织中
期刊
强化学习因为与深度神经网络的结合使其可以处理高维非线性问题而成为近些年来研究的热点之一,虽然其具有良好的采样效率,但是却需要有效的探索使其达到较好的效果。而进化算法(EA)在近些年的工作中被认为是可以代替强化学习的方法之一,其具有较强的探索能力,同时由于种群的存在使其具有良好的并行性,但是其却受到采样效率低下的限制。所以二者的优缺点具有一定的互补性,因此越来越多的工作开始将两类算法进行组合,其中进
学位
不可逆电穿孔(Irreversible electroporation,IRE)肿瘤消融技术是一种新型肿瘤消融物理治疗方法,具有对大血管毗邻的肿瘤进行消融,且不损伤血管的优势。电脉冲参数是不可逆电穿孔治疗效果和安全性的关键参数,在临床应用中有多种选择,造成治疗效果的不确定性。电脉冲生物效应有无效、可逆电穿孔、不可逆电穿孔和热效应四种。可逆电穿孔的生物效应主要是细胞膜渗透性增加,不可逆电穿孔的生物效
学位
研究生党支部是高校党组织团结和引领广大青年学生的重要阵地。加强研究生党支部规范化建设是落实全面从严治党的必然要求和建设高质量教育体系的有力保障,也是推动研究生全面发展的重要力量。但目前高校研究生党支部仍存在支部设置不合理、发展党员工作流于形式、支部保障机制有待完善以及组织生活缺乏创新等问题。对支部组织建设、党员发展评价体系、支部管理方式和党内外沟通机制等进行方式方法创新,可推进研究生党支部的规范化
期刊
AIM2(Absent in Melanoma 2)作为胞质DNA感受器,可以直接识别并结合双链DNA,活化炎症小体复合物,促进白细胞介素(Interleukin,IL)IL-1β和IL-18的成熟分泌,参与宿主免疫防御。FBXW7(F-box/WD repeat-containing protein 7)是一种SCF E3泛素连接酶,在细胞分裂、生长和分化中起到重要调控作用,作为一种抑癌基因被广
学位
一直以来,身份验证都被广泛应用在生活和工作的各个方面,随着计算机科学和硬件技术的发展,身份验证技术的应用场景变得更加复杂和多样化,传统身份验证技术受到了极大地挑战,逐渐朝着向电子化、智能化发展。人体的生物学特征取样自受试者,具有唯一性、稳定性、安全性、普遍性等天然优势,因此被优先考虑用于身份验证。截至目前,指纹识别、人脸识别已经在各种场合得到了广泛应用,但都存在着一定的缺陷。虹膜生物学特征在唯一性
学位
剂量反应Meta分析(dose-response Meta-analysis,DRMA)是基于多项提供剂量反应关系数据的原始研究,对其剂量反应结果进行定量合并后得出综合剂量反应直线或曲线的一类Meta分析,广泛应用于循证证据产生及临床决策等方面。目前已发表DRMA结果的可靠性和文章质量水平不一,而且国际上暂无DRMA的统一报告规范。本研究系统梳理了DRMA的本质、各步骤统计方法及常见统计分析问题,
期刊
随着信息时代的到来,数据的表现形式越来越多样化,推理一种现象发生的可行性不能仅依靠信息拥有者有限的知识水平,需要综合考量各方面的因素,例如判断一个人消费意愿需,不能仅根据他的购买记录,要同时考虑他的购买能力,而这两种数据多数情况下并不会隶属于同一机构。上述情景便涉及到多机构联合学习的问题,传统的方式是将数据集中起来进行机器学习模型的构建。然而,然而随着国家对隐私保护的逐渐重视,以及隐私保护法律的逐
学位