复述平行语料构建及其应用方法研究

来源 :北京大学学报:自然科学版 | 被引量 : 0次 | 上传用户：wh820228

【摘要】

：

以汉语为研究对象,提出构建大规模高质量汉语复述平行语料的方法。基于翻译引擎进行复述数据增强,将英语复述平行语料迁移到汉语中,同时人工构建汉语复述评测数据集。基于构

【作者】

：

王雅松刘明童张玉洁徐金安陈钰枫

【机构】

：

北京交通大学计算机与信息技术学院

【出处】

：

北京大学学报:自然科学版

【发表日期】

：

2021年1期

【关键词】

：

复述语料构建数据增强迁移学习复述识别自然语言推理 paraphrase corpus construction data augmentation tr

【基金项目】

：

国家自然科学基金(61876198,61976015,61976016)资助

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

以汉语为研究对象,提出构建大规模高质量汉语复述平行语料的方法。基于翻译引擎进行复述数据增强,将英语复述平行语料迁移到汉语中,同时人工构建汉语复述评测数据集。基于构建的汉语复述数据,在复述识别和自然语言推理任务中验证复述数据构建及其应用方法的有效性。首先基于复述语料生成复述识别数据集,预训练基于注意力机制的神经网络句子匹配模型,训练模型捕获复述信息,然后将预训练的模型用于自然语言推理任务,改进其性能。在自然语言推理公开数据集上的评测结果表明,所构建的复述语料可有效地应用在复述识别任务中,模型可以学习复述知识

其他文献

顺序评价试验方法及其应用

对ISO 8858-2《硬煤-浮选试验第2部分：顺序评价》试验方法中的试验条件、试验流程、操作方法与试验步骤进行了简单介绍,指出该试验方法可用于获得浮选理论指标,是代替小浮沉的

期刊

顺序评价试验方法浮选试验分布释放试验sequential evaluation testing method flotation testing

基于螺旋线三棱锥阵的三维匹配定位算法

在滑坡泥石流等地质灾害发生前夕,灾害体内的岩石土块发生爆裂、摩擦和断裂等破坏会产生次声波信号,利用次声信号进行三维超前定位是地质灾害防治技术研究前沿。本文在柱坐标

期刊

地质灾害次声波螺旋线三棱锥阵三维匹配定位算法geologic hazardsinfrasoundhelix triangular pyramid a

南繁区稻瘟病菌遗传多样性和群体遗传结构的AFLP分析

【目的】为了明确南繁区稻瘟病菌(Magnaportheoryzae)的遗传分化情况，【方法】采用AFLP分子标记技术对南繁核心区(三亚、乐东和保亭)和非核心区(琼中、屯昌和定安)共60个稻瘟

期刊

南繁区稻瘟病菌遗传多样性群体遗传结构AFLPSouth China Crop Breeding Area Magnaporthe oryzae g

一种卫星SCMA系统接收机同步算法

SCMA技术通过资源过载能够实现大规模用户的并发接入,非常适合物联网应用,但是SCMA解调性能受定时误差和载波频差影响较大。对此,文中通过基于导频的两阶段频差估计算法和ML

期刊

卫星SCMA系统载波同步定时同步联合迭代satellite SCMA systemcarrier synchronizationtiming syn

长期水驱砂岩油藏的生产动态及变化机理

强底水砂岩储层通常采用大排量水驱开发,长期水驱后储层水驱特征发生巨大变化。本文采用新的实验方法获得了油水相渗、采收率以及润湿性曲线,并基于试验结果研究了水驱体积倍

期刊

长期水驱砂岩油藏相渗曲线润湿性long-term water floodingsandstone reservoirrelative permeab

PPH术治疗直肠脱垂的护理体会

目的：探讨吻合器痔上黏膜环切术（PPH）治疗直肠脱垂的护理体会。方法：将我院2011年6月～2012年7月我院治疗的86例直肠脱垂型患者随机分为两组,所有患者均采用PPH术治疗,其中,对照组

期刊

PPH术直肠脱垂围手术护理

水细胞敷料和水胶原敷料治疗压疮效果的Meta分析

目的:采用Meta分析法分析并比较用水细胞敷料和水胶原敷料治疗压疮的效果。方法:按照系统评价/Meta分析报告指南(PRISMA)制定数据库检索策略,分别检索外文数据库和中文数据库

期刊

水细胞敷料水胶原敷料压疮META分析治愈率不良反应water cell dressingWater collagen dressingPress

复述平行语料构建及其应用方法研究

其他学术论文