基于增量式自学习策略的多语言翻译模型

来源 :厦门大学学报:自然科学版 | 被引量 : 0次 | 上传用户:weinziel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对源语言到目标语言缺乏平行语料的情况,提出了一种基于增量式自学习策略的多语言翻译模型,即利用中介语双语语料训练源语言到目标语言的翻译模型.在Transformer架构下,相比于基于中介语和直接在伪平行语料上训练的普通双语翻译模型,使用该方法在第十四届全国机器翻译研讨会(CWMT2018)多语言翻译评测数据集上的机器双语互译评估(BLEU)值提升了0.98个百分点.在此基础上,还对比了不同的预处理方法、训练策略以及多模型的平均和集成策略,其中多模型集成策略的BLEU值上可在多模型策略的基础上进一步提升0.
其他文献
本文详细分析了建筑工程剪力墙配电箱安装工艺的现状及缺点,并分析了现在剪力墙配电箱安装工艺造成墙体开裂等质量问题且废工废料的原因,制定措施克服以上问题并论证了新工艺
Euro-Art是一个国际性财团,由英国Thorn EMI电子公司,德国Simens公司,法国Thomson-CSF公司和美国GE公司组成。该财团已获得价值约1亿英磅的合同,为英国、德国和法国研制“眼
《电力电子技术》课程是电气专业的专业基础,也是一门工程技术,广泛用于几乎所有与电能相关的领域。文章结合高职院校学生的实际情况,以及《电力电子技术》课程的特点和教学
“互联网+”时代促使互联网发挥集中与优化社会资源的有效作用,实现行业的传统升级。我国中西部第三方物流较为落后,其旅游特色产品出现供需矛盾的直接表现即是物流业的瓶颈
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
我国已进入了老龄化社会,选择合适的养老模式对提高老年人的生活质量至关重要,通过借鉴发达国家的养老经验,同时结合我国的老龄化现状——老年化速度快,老龄化人口持续增多及
粗苯的形成是通过脱氯后的焦炉煤气中回收的苯系化合物,是煤热解生成的粗煤气中的产物之一。本文对粗苯回收进行了简要分析,其次对影响粗苯回收的主要因素进行探讨,希望对相
袁店一井煤矿10煤具有Ⅱ类自燃发火倾向性,其首采工作面面收作后,采取堵漏风、均压技术等综合防火措施,切断了采空区的漏风通道,同时加强预测预报,有效地预防了煤层自燃发火