面向对话的实体关系抽取研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:CT19850329
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络的迅速发展带来了海量的对话数据,如何从这些对话数据中提取有用的信息成为了新的研究热点。面向对话的实体关系抽取任务旨在判断对话文本中各个实体对之间存在的关系,进而辅助知识图谱构建、对话生成等下游任务的进行。作为一个刚刚起步的任务,面向对话的实体关系抽取有很多问题需要解决。本文针对该任务的三个不同的问题提出了相应的解决方案,主要内容如下:(1)针对面向对话的实体关系抽取模型难以捕获对话的图结构的问题,本文提出了一种使用GCN(Graph Convolutional Network)整合对话结构特征的方法。该方法根据对话文本是图结构文本而非序列式文本的结构特征,为对话文本构建对话情景图,然后使用GCN来聚合结构信息,从而加强了模型对于对话结构的理解。实验结果表明,该模型能有效地利用对话的结构信息,与基准模型相比,DialogRE测试集上的F1值提升了 5.5%,F1c值提升了 5.1%。(2)针对面向对话的实体关系抽取模型对于同指关系组的识别能力不足导致的关系判别级联错误问题,本文提出了一种基于多任务学习的方法。该方法使用硬参数共享方案,将实体同指任务引入面向对话的实体关系抽取模型,增强了模型对同指关系组的判别能力。实验结果表明,该模型对同指关系的判断力得到了明显的提升,进而提升了模型判别实体关系的整体能力。与基准模型相比,DialogRE测试集上的F1值提升了 3.1%,F1c值提升了 1.4%。(3)针对面向对话的实体关系抽取模型细粒度特征利用不足的问题,本文提出了一种多粒度特征抽取的方法。该方法通过在BERT模型不同层次抽取不同粒度的特征,更好地挖掘了触发词、句式等信息。为了利用实体类型信息提高关系分类的准确性,该方法设计了一种类型置信机制,该机制可以利用实体类型信息辅助关系的推理。实验结果表明,融合不同粒度的特征后,与基准模型相比,模型在DialogRE测试集上的F1得分提升了 4.2%,F1c得分提升了 1.9%。本文围绕面向对话的实体关系抽取任务展开研究,分析了当前任务中存在的实际问题并提出了解决方案,为关系抽取的进一步研究提供了思路。
其他文献
目的:通过收集直肠癌手术患者的临床资料,分析直肠癌术后吻合口漏(Anastomotic Leakage,AL)发生的危险因素,并且构建一个风险模型来预测吻合口漏的发生。方法:收集2013年1月至2018年12月于苏州大学附属第一医院行直肠癌根治手术病人的临床信息,排除数据缺失的患者后最终一共有777名患者纳入我们的研究。我们将患者以1:1随机分成训练组389例和验证组388例。随后,为了构建一个更
学位
目的:本研究基于糖尿病专科联盟管理模式来规范社区糖尿病管理,并分析该模式对社区老年糖尿病患者糖脂等代谢性指标和糖尿病慢性并发症的控制情况,以及在提升糖尿病自我管理能力和改善生活质量等方面的有效性,为社区糖尿病管理提供参考和借鉴。方法:本研究自2018年5月至2019年5月期间,6个社区共纳入835例受试者,将6个社区卫生服务站随机分为对照组和实验组,实验组社区受试者为451例,对照组社区为384例
学位
研究目的:首先分析导致胰十二指肠切除术(Pancreatoduodenectomy,PD)后发生胰瘘的危险因素,包括生化指标、炎症指标以及相关临床指标,接着采用单因素回归结合最小绝对收缩和选择操作回归(Least absolute shrinkage and selection operator,LASSO)、单因素回归结合多因素Logistic回归、随机森林分析(Random survival
学位
近年来,随着自然语言处理研究逐渐深入,越来越多的研究者把研究重点转向宏观中文篇章层级。篇章分析致力于挖掘篇章内部信息,从而为全文建立起宏观理解并为下游任务提供帮助。本文聚焦于中文宏观篇章关系识别开展研究,在连贯的篇章中,篇章的各级单位称为篇章单元,篇章关系识别旨在探索篇章单元之间的语义逻辑关系。篇章关系识别面临着篇章单元间语义交互、篇章单元表示、篇章关系表示的挑战,本文针对这三项挑战展开深入研究,
学位
目的:评估营养指标,包括维生素D相关指标、老年营养风险指数(geriatric nutritional risk index,GNRI)、那不勒斯预后评分(Naples prognostic score,NPS)在非小细胞肺癌(non-small cell lung cancer,NSCLC)患者中的表达或表现情况,并探讨它们与NSCLC患者总生存期(overall survival,OS)和无病
学位
氧代谢是指在生命系统中,氧气在组织和细胞中如何传递、运输和消耗的一系列过程,活性氧(ROS)正是在这一过程中产生的。ROS在生命活动中扮演着双重角色,在正常的生理浓度范围内,ROS通过细胞内氧化还原信号传递来调节免疫应答、代谢、细胞分化等对机体生理活动密切相关的行为。ROS浓度过高则会对蛋白质、脂质、核酸和组织等造成损伤,进而导致其稳定性和功能的改变。因此,准确、便捷地监测生物体中的ROS对进一步
学位
家蚕的遗传学背景清楚,是鳞翅目昆虫的模式种,也是重要的经济昆虫。丝腺能在短期内大量合成丝蛋白,被认为是世界上合成蛋白效率最高的器官。丝蛋白合成是家蚕最重要的经济性状,决定蚕丝的产量和质量。丝蛋白的高效合成与调节机制一直是家蚕生物学最重要的研究内容,人们已从基因组学、丝腺转录组学和蛋白质组学、丝腺组织发育、丝腺细胞大小调控、丝腺细胞高效核内复制、性别与丝蛋白合成、丝蛋白基因的转录与翻译等多角度探讨丝
学位
目标计数是计算机视觉领域的一个重要分支,近年来因其实用性而广受关注。目标计数可以估计密集场景下人群数量,助力公共安全工作;也可以测算路面车流量,为城市交通管控提供决策支持。随着卷积神经网络被应用到该领域,相关的研究在准确性上面取得了长足的进步。但是,目前的研究几乎都聚焦于单类别的计数上。另外,为了提高计数的准确性,网络结构逐渐变得复杂,体量也在逐渐变大。然而,复杂的大型网络对硬件依赖度较高,难以部
学位
胶质母细胞瘤是中枢神经系统最恶性的肿瘤。胶质瘤干细胞是导致胶质瘤患者早期复发和低总生存期等不良后果的原因。靶向胶质瘤干细胞被认为是一种很有前途的抗胶质瘤策略。而免疫疗法的发现为神经胶质瘤的治疗提供了新的思路。然而,胶质瘤干细胞对PD-1/PD-L1治疗不敏感,并以免疫逃逸为明显特征。因此,有必要了解胶质瘤干细胞(glioma stem cells,GSCs)在免疫逃逸中的分子机制,寻找有效的免疫治
学位
高性能的癫痫脑电信号自动检测方法对减轻医生负担并提高癫痫的诊断效率具有重要临床研究意义。论文提出了一种能够区分正常、癫痫发作和发作间期脑电信号的高性能三分类系统。采用Daubechies 4小波构成的4级提升式小波变换将脑电信号分解为不同子带信号,求得不同子带信号的近似熵、Teager能量、局部波动率、自回归系数、Hurst指数特征值;利用Fisher得分法进行特征选择,提高分类精度同时减小计算复
期刊