复述平行语料构建及其应用方法研究

来源 :北京大学学报:自然科学版 | 被引量 : 0次 | 上传用户:wh820228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以汉语为研究对象,提出构建大规模高质量汉语复述平行语料的方法。基于翻译引擎进行复述数据增强,将英语复述平行语料迁移到汉语中,同时人工构建汉语复述评测数据集。基于构建的汉语复述数据,在复述识别和自然语言推理任务中验证复述数据构建及其应用方法的有效性。首先基于复述语料生成复述识别数据集,预训练基于注意力机制的神经网络句子匹配模型,训练模型捕获复述信息,然后将预训练的模型用于自然语言推理任务,改进其性能。在自然语言推理公开数据集上的评测结果表明,所构建的复述语料可有效地应用在复述识别任务中,模型可以学习复述知识
其他文献
收入流动性主要有两种研究思路,一是将流动性本身作为研究对象,对个体流动进行加总,反映了所有个体收入水平、位次或收入份额的平均变动程度;二是研究收入流动性的影响,主要
对ISO 8858-2《硬煤-浮选试验第2部分:顺序评价》试验方法中的试验条件、试验流程、操作方法与试验步骤进行了简单介绍,指出该试验方法可用于获得浮选理论指标,是代替小浮沉的
为加强选煤设备制造企业与选煤生产企业间的沟通与合作,有效推进当代选煤前沿技术和设备在选煤行业的应用,积极推动选煤大国向选煤强国迈进,《煤炭加工与综合利用》杂志社将
在滑坡泥石流等地质灾害发生前夕,灾害体内的岩石土块发生爆裂、摩擦和断裂等破坏会产生次声波信号,利用次声信号进行三维超前定位是地质灾害防治技术研究前沿。本文在柱坐标
【目的】为了明确南繁区稻瘟病菌(Magnaportheoryzae)的遗传分化情况,【方法】采用AFLP分子标记技术对南繁核心区(三亚、乐东和保亭)和非核心区(琼中、屯昌和定安)共60个稻瘟
SCMA技术通过资源过载能够实现大规模用户的并发接入,非常适合物联网应用,但是SCMA解调性能受定时误差和载波频差影响较大。对此,文中通过基于导频的两阶段频差估计算法和ML
强底水砂岩储层通常采用大排量水驱开发,长期水驱后储层水驱特征发生巨大变化。本文采用新的实验方法获得了油水相渗、采收率以及润湿性曲线,并基于试验结果研究了水驱体积倍
以哥伦比亚烟煤、南非烟煤、印尼褐煤等为待测样品进行煤质分析项目的测定,分别从样品的保存时间及样品的粒度变化对检测结果的影响方面探究分析试验煤样粒度对检测重复性的
目的:探讨吻合器痔上黏膜环切术(PPH)治疗直肠脱垂的护理体会。方法:将我院2011年6月~2012年7月我院治疗的86例直肠脱垂型患者随机分为两组,所有患者均采用PPH术治疗,其中,对照组
目的:采用Meta分析法分析并比较用水细胞敷料和水胶原敷料治疗压疮的效果。方法:按照系统评价/Meta分析报告指南(PRISMA)制定数据库检索策略,分别检索外文数据库和中文数据库