【摘 要】
:
脚本事件预测是指给定一系列已经发生的事件,预测后续发生的事件。该任务对于许多自然语言理解应用至关重要,例如文本理解、意图识别和问答系统。脚本事件预测是事件抽取的下游任务,目前还存在数据集缺乏、事件表示不全面、信息融合不充分等问题。现有的方法尚不能很好地解决这些问题。本文以脚本事件预测为研究课题,主要研究内容如下:首先,构建了一个基于新浪新闻的中文数据集SinaNews。目前,脚本事件预测任务仅有一
论文部分内容阅读
脚本事件预测是指给定一系列已经发生的事件,预测后续发生的事件。该任务对于许多自然语言理解应用至关重要,例如文本理解、意图识别和问答系统。脚本事件预测是事件抽取的下游任务,目前还存在数据集缺乏、事件表示不全面、信息融合不充分等问题。现有的方法尚不能很好地解决这些问题。本文以脚本事件预测为研究课题,主要研究内容如下:首先,构建了一个基于新浪新闻的中文数据集SinaNews。目前,脚本事件预测任务仅有一个基于纽约时报的英文数据集NYT,这极大地限制了国内外学者对该任务的研究。本文按照脚本事件预测任务的处理流程,基于新浪网的新闻语料构建了一个涵盖娱乐、经济和军事等各个板块的中文数据集SinaNews,该数据集和NYT英文数据集的规模相当,具有广泛的适用性。其次,研究了事件表示对脚本事件预测的支撑作用,提出了一种新的事件表示方法。在脚本事件预测任务中,事件用四元组(谓语,主语,宾语,介词宾语)的形式表示。现有方法把四元组中的词向量进行拼接作为整个事件的表示,导致事件表示过度依赖词向量而忽略了四元组中各个词之间的语义关联。本文提出了一种基于Transformer的事件表示方法,捕获事件内部各个元素间的语义关联从而得到更准确的事件表示。再次,提出了一种结合事件链和事理图谱的脚本事件预测方法(ECGNet)。事件链中的各个事件之间的时序信息和事理图谱中隐藏的事件演化信息对于脚本事件预测都是非常重要的,然而现有方法没有同时考虑时序信息和演化信息对后续预测的影响。本文提出了一种结合事件链和事理图谱的方法(ECGNet),充分学习事件链中的时序信息和事理图谱中的演化信息,利用两种特征共同预测后续事件,提升了预测效果。最后,提出了一种动态融合多元信息的脚本事件预测方法(Gate-ECGNet)。Gate-ECGNet对ECGNet的事件表示方法和特征融合方法进行了改进。事件表示层不仅考虑了事件内部各个元素之间的语义关联,还融合了上下文事件动词之间的共现关系。此外,Gate-ECGNet模型设计了一种门控注意力机制来学习时序信息和演化信息对于不同样本的置信度,从而动态融合特征进行后续事件预测,进一步提升了预测效果。本文通过大量的实验对ECGNet和Gate-ECGNet模型进行了评估。实验结果表明,本文提出的脚本事件预测方法能够较好地融合多元信息进行事件预测,在中英文数据集上均优于现有的脚本事件预测方法,而Gate-ECGNet模型可以动态融合多元信息,因此其预测性能更胜一筹。
其他文献
低速无人车在货物运输、园区观光等方面有着广阔的应用前景。windows下进行的低速无人车开发会造成各个模块之间的高度耦合,从而大大降低系统鲁棒性,也给错误的排查带来了很高的时间成本。针对这些问题,本文基于ROS进行低速无人车环境感知与车辆控制算法的研究并搭建硬件平台,最终完成了校园环境下既定路线的低速无人驾驶。论文完成了基于ROS的无人车整体方案设计,在基于低速电动车改装的无人车平台上设计了车辆感
多源图像融合是将多类型图像数据中的互补信息进行有效的提取和整合,剔除冗余信息,生成信息更丰富、对场景描述更为准确的融合图像。多源图像融合技术有助于改善单一类型图像信息量不足的问题,提高多源图像数据处理的效率。目前,多源图像融合技术在军事、遥感、监控和医学图像等领域已得到了广泛应用。在各类图像中,红外与可见光图像在图像处理领域的应用最为广泛,且具有良好的信息互补能力。二者融合可以将可见光图像中丰富的
随着高速列车信息化与智能化水平的提升和“一体化屏幕”的引入,驾驶模式与驾驶界面出现了新的变化,良好的驾驶界面与信息组织模式能够实现驾驶员与系统的良好交互,从而提高高速列车运行的效率与安全性,因此有必要对高速列车驾驶界面信息组织模式的设计展开研究。本文构建了高速列车驾驶界面系统透明度等级模型,在此基础上,以高速列车故障处理界面为研究对象,设计了其界面信息组织模式,并通过人因实验验证了高速列车驾驶界面
近两年来,新型冠状病毒性肺炎已经造成了世界大流行的局面,该病毒最初是2019年末在武汉报道,随后在世界范围内传播。如今,更是有了病毒的变种,且已陆续在多个国家出现,对全球人类的健康构成了重大威胁。因此,新冠肺炎检测的相关研究具有深远且迫在眉睫的现实意义,它不仅可以高效快速地做出判断,还可以为医护人员提供指导信息,同时也在某种意义上对于个体的安全有了保障。为此,有必要提出一种检测系统来快速辅助诊断,
我国逐渐形成以“八纵八横”为短期规划的高速铁路网,与此同时,高速铁路也以其运行速度快、正点率高、输送能力强等特点受到人们的青睐。然而,因为各种不可避免的因素的干扰,列车的运行时常会偏离计划的时刻表。若未及时且有效的调整列车的运行计划,可能会危及行车安全。为了能给调度员提供较为精准的列车晚点信息,有效缓解因干扰而造成铁路运输效率下降和安全性降低等问题,本文实现了对列车到达晚点和出发晚点的准确预测。具
随着“十四五规划”和《中国制造2025》的提出,国家把“实施制造强国战略”提到了更加显著的位置。制造业是我国的支柱型行业,对国家的经济发展影响深远。在过去,一般传统制造企业的装配方式是单一装配线进行大批量生产装配,而随着用户需求的不断变化和市场竞争的逐渐加剧,混流装配线作为一种高效的生产方式逐渐取代单一装配线,在制造业中应用非常广泛。然而,由于混流装配线可以装配不同类型的产品,这些产品存在一定的共
超疏水材料由于其特殊浸润性引起人们的广泛关注,在防尘自清洁、防冰防雾、防腐蚀、油水分离等领域都展示出广阔的应用前景。随着研究和应用的深入,人们进一步对具有独特光学特性的透明超疏水材料产生了新的需求。人工透明超疏水表面的构筑中,目标表面的低表面能和在目标表面上构筑精巧微观结构是实现表面透明和超疏水的两大关键因素。尽管已经取得了一些进展,但是目前透明超疏水材料在耐久性方面还存在诸多问题,例如,容易被机
短视频电商分销将传统的线下分销商品转化为通过与短视频内容创作者合作直播或拍摄短视频进行产品的推广与售卖,将短视频用户转化为分销者,利用其流量进行获客。网络分销的优势体现在可以利用网络红人的明星效应,分销者只需要通过直播或短视频做好产品介绍,是零风险的代理模式;而供应商负责品牌推广、商品上单、订单核销及售后服务。本项目为快手本地生活提供给创作者找到本地生活商品进行分销的CPS平台,解决大部分没有私域
随着经济的飞速发展,我国的建筑结构已逐步朝着高层化,复杂化,多样化的方向发展。同时也面临着更严格的工程条件和更复杂的施工环境,许多应运而生的新变化、新思想和新要求使得普通混凝土已经无法满足现代建筑需求,需要更高性能的混凝土来代替普通混凝土。另外,传统的河砂日益枯竭,机制砂已经逐渐成为其可靠的替代品。相比于普通混凝土,机制砂混凝土同时具备高流动性,且原材料丰富。但是,有关普通混凝土性能指标的试验方案
以微流控通道为核心分析设备由于其具有便携性、低功耗、自动化、样品和试剂消耗少等优点有望取代传统的生化分析设备在生物技术、药物检测、环境分析等许多领域中的应用;基于光子晶体及金属等离子激元特性的生化传感器由于其灵敏度高、响应速度快、可以实现生化样品的实时监测等优点正受到越开越多研究者的青睐。本文围绕可以在微流通道下构建的胶体基光子晶体结构为研究核心,在微流通道下成功构建了含有聚苯乙烯微球光子晶体结构