中文宏观篇章关系识别研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:zxf3896641
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着自然语言处理研究逐渐深入,越来越多的研究者把研究重点转向宏观中文篇章层级。篇章分析致力于挖掘篇章内部信息,从而为全文建立起宏观理解并为下游任务提供帮助。本文聚焦于中文宏观篇章关系识别开展研究,在连贯的篇章中,篇章的各级单位称为篇章单元,篇章关系识别旨在探索篇章单元之间的语义逻辑关系。篇章关系识别面临着篇章单元间语义交互、篇章单元表示、篇章关系表示的挑战,本文针对这三项挑战展开深入研究,主要研究内容包括以下三个方面:(1)基于依存图卷积的中文宏观篇章关系识别方法考虑到以往的篇章关系识别方法既缺少从全文的宏观视角上来进行建模,也缺少捕获两个篇章单元之间词语的依赖关系。因此本文提出了一种将预训练语言模型和依存图卷积相结合的方法来识别篇章关系。首先,本文在预训练语言模型中引入篇章标题从篇章全局的角度出发辅助篇章单元建模;然后,分别构建基于依存关系的内部话题图和基于话题一致性的交互话题图;最后,通过图卷积神经网络整合内部话题图和交互话题图,加强了篇章单元之间的交互。实验结果显示本文提出模型的性能优于多个基准模型。(2)基于语义和主题的中文宏观篇章关系识别方法为解决篇章单元长度过长,传统表示方法难以有效建模的问题,本文提出了一种将篇章单元语义信息建模和主题信息建模相结合的方法。通过预训练的语义表示模块更好的对篇章单元进行编码,发掘篇章单元间的隐含关系;同时借助主题表示模块压缩语段的长度,借助主题信息,辅助模型从主题的角度上更好地理解篇章单元。实验结果显示本文提出模型的性能优于多个基准模型,从整体上提高了篇章关系识别的性能。(3)基于联合关系嵌入的中文宏观篇章关系识别方法鉴于目前工作集中在对篇章单元进行建模,或者改进两个篇章单元之间的交互方式,缺少挖掘篇章关系自身的理解。因此,本文提出了一个联合关系嵌入模型以建模篇章关系的语义连贯性。首先,本文使用关系名称嵌入,将关系标签的名称集合插入篇章单元之间作为形式上的显式连接词,以获得篇章关系在篇章单元文本中的浅层语义连贯性表示;然后,引入关系转移嵌入,使用基于转移的方法训练关系嵌入矩阵,学习篇章关系在篇章结构中的深层语义连贯表示;最后,应用关系匹配和联合学习使不同层次的语义连贯性表示共同辅助篇章关系识别。实验结果显示本文提出模型的性能优于多个基准模型。本文针对中文宏观篇章关系识别任务,提出了有效的解决方法,取得了良好的性能,将为中文宏观篇章分析的进一步研究提供借鉴。
其他文献
目的:帕金森病(Parkinson’s disease,PD)相关疼痛的临床表现复杂,具体发生机制不明,评估手段有限,治疗率低和治疗方法不足,严重影响了患者的生活质量。本研究采用静息态和情绪任务脑电图(Electroencephalogram,EEG)分析技术,研究伴慢性骨骼肌疼痛的早期PD患者的脑电频谱、功能连接和情绪任务事件相关电位(Event-related Potentials,ERP)的
学位
具有特殊润湿性能的超疏水纺织品因其在自清洁、油水分离、防冰以及抗生物污染表面上的潜在用途,而在基础研究和工业应用中引起了极大的关注。但是目前大多数超疏水涂层普遍容易受到机械磨损、高温环境、腐蚀溶剂等恶劣条件的影响而降低或失去超疏水功能,这归因于超疏水表面微纳米结构缺乏机械稳定性和表面化学稳定性,因此提高超疏水性能的耐用性具有重大研究意义。本文基于多巴胺,通过巯基-烯点击化学研究了三种制备尼龙56/
学位
目的:颅内动脉瘤(Intracrnial Aneurysm)是由于颅内动脉血管内腔的局限性异常扩大,导致动脉血管壁的瘤状突出。关于治疗颅内破裂动脉瘤的手术时机一直存在争议,目前对于颅内破裂动脉瘤Hunt-Hess Ⅰ-Ⅱ级的患者,因为患者颅内出血量少,脑水肿及脑肿胀较轻,及早的手术可以降低患者在等待手术治疗过程中发生再次出血的可能性,从而为患者带来更好的预后,对于Hunt-HessV级的患者,患者
学位
相较于传统Ⅱ-Ⅵ或Ⅰ-Ⅲ-Ⅵ族半导体量子点,金属硫族超四面体团簇具有尺寸均一、结构精确和组分多样等特点,且在簇内组分精确掺杂和簇表面修饰等方面展现出较高的可控性优势,为后续构效关系的深入研究提供了便利;其次,团簇间可调的组装模式在一定程度上为金属硫族化合物的性能开发提供了丰富的簇基组装体。然而,由于簇间金属-硫(或硒)-金属(M-S/Se-M)配位角度的局限性,仅通过簇间共享S/Se顶点的组装模式
学位
目的:骨质疏松症(Osteoporosis,OP)时骨折愈合能力严重下降,导致骨折延迟愈合、不愈合的风险增加。近期的研究表明,氧化应激在骨质疏松症中发挥重要作用。白藜芦醇(Resveratrol,RES)是一种天然来源的抗氧化剂,可增强骨细胞成骨分化能力,并减轻骨质疏松症,但因为其生物有效性低,体内代谢迅速,因此目前尚无白藜芦醇应用于局部骨质疏松性骨缺损的研究。有研究表明,将β-磷酸钙((3-TC
学位
在过去几十年中,研究者们不断探索将纳米技术用于癌症治疗,通过物理包埋或化学连接将各种治疗剂或成像剂负载到纳米载体中,已经实现了增强溶解性、靶向给药和减少全身毒性的功效,但纳米药物在肿瘤处的累积量仍然有限。为了克服传统纳米药物在肿瘤靶向效率方面的局限性,迫切需要探索靶向配体与聚合物纳米粒子相偶联的药物递送系统,用以增强纳米药物与肿瘤的特异性结合。本论文选取了 cRGD肽与核酸适配体两种靶向分子,分别
学位
研究目的:高毒力肺炎克雷伯菌(hypervirulent Klebsiella pneumoniae,hvKP)不同于经典肺炎克雷伯菌(classical Klebsiella pneumoniae,cKP),其具有更强的致病力,在健康人群中也可引起严重感染。多数hvKP菌株对除氨苄青霉素外的抗菌素是敏感的,但不断出现的多重耐药的hvKP对人类健康造成了巨大威胁。RcsAB双组分系统在大肠埃希菌中
学位
目的:通过收集直肠癌手术患者的临床资料,分析直肠癌术后吻合口漏(Anastomotic Leakage,AL)发生的危险因素,并且构建一个风险模型来预测吻合口漏的发生。方法:收集2013年1月至2018年12月于苏州大学附属第一医院行直肠癌根治手术病人的临床信息,排除数据缺失的患者后最终一共有777名患者纳入我们的研究。我们将患者以1:1随机分成训练组389例和验证组388例。随后,为了构建一个更
学位
目的:本研究基于糖尿病专科联盟管理模式来规范社区糖尿病管理,并分析该模式对社区老年糖尿病患者糖脂等代谢性指标和糖尿病慢性并发症的控制情况,以及在提升糖尿病自我管理能力和改善生活质量等方面的有效性,为社区糖尿病管理提供参考和借鉴。方法:本研究自2018年5月至2019年5月期间,6个社区共纳入835例受试者,将6个社区卫生服务站随机分为对照组和实验组,实验组社区受试者为451例,对照组社区为384例
学位
研究目的:首先分析导致胰十二指肠切除术(Pancreatoduodenectomy,PD)后发生胰瘘的危险因素,包括生化指标、炎症指标以及相关临床指标,接着采用单因素回归结合最小绝对收缩和选择操作回归(Least absolute shrinkage and selection operator,LASSO)、单因素回归结合多因素Logistic回归、随机森林分析(Random survival
学位