神经机器翻译的词级别正则化

来源 :厦门大学学报(自然科学版) | 被引量 : 0次 | 上传用户：life11231

【摘要】

：

由于神经机器翻译模型具有大规模参数且其性能极大地依赖大规模高质量平行语料,当训练数据规模小于模型复杂度时,模型易出现过拟合问题而泛化能力不足.针对此问题,研究了词级别的正则化技术,通过对模型输入句子中的单词进行随机干扰,以此削弱数据的特异性,从而抑制模型对于数据的过度学习,防止过拟合,提高模型的泛化能力.通过Transformer模型在标准规模中文-英语数据集和中小规模英语-土耳其语数据集上进行的

【作者】

：

邱石贵章化奥段湘煜张民

【机构】

：

苏州大学计算机科学与技术学院

【出处】

：

厦门大学学报(自然科学版)

【发表日期】

：

2021年04期

【关键词】

：

神经机器翻译泛化能力过拟合正则化

【基金项目】

：

国家自然科学基金(61673289)。

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

基于卷积神经网络和迁移学习的钢桥病害识别

针对钢桥病害识别效率低、精度不高的现状,提出了一种基于深度学习的钢结构表观病害识别方法。该方法将卷积神经网络Inception-v4和迁移学习相结合,分别采用迁移学习中特征提取和微调2种训练方式获得2种模型,并与全新训练的Inception-v4模型进行对比。首先,收集656幅钢桥病害图像,包括涂层劣化176幅,腐蚀173幅,焊缝开裂151幅,完好156幅,对其进行旋转、翻转、调整对比度等预处理,

期刊

桥梁工程钢桥病害识别卷积神经网络迁移学习Inception-v4图像处理

浅谈课外阅读对初中语文作文教学的重要性

在新的基础教育课程改革不断推进、不断深入的过程中,初中语文教学在教学模式、教学方案、教学目的等多个方面都发生了巨大的改变.现阶段的初中语文教学更加重视学生的基础素

期刊

课外阅读拓展训练作文教学

面向低资源神经机器翻译的回译方法

神经机器翻译在高资源情况下已经获得了巨大的成功,但是对低资源情况翻译效果还有待提高.目前,维吾尔语-汉语(维汉)翻译和蒙古语-汉语(蒙汉)翻译都属于低资源情况下的翻译任

期刊

神经机器翻译低资源语言回译领域相似性预训练

基于掩码机制的非自回归神经机器翻译

当前基于自注意力机制的神经机器翻译模型取得了长足的进展,但是采用自回归的神经机器翻译在解码过程中无法并行计算,耗费时间过长.为此,提出了一个采用非自回归的神经机器翻

期刊

神经机器翻译掩码机制非自回归

常泰长江大桥塔柱偏心距增大系数的计算方法

为探究规范公式在计算空间钻石形桥塔塔肢偏心距增大系数时的适用性,并保证大跨度斜拉桥桥塔结构配筋设计的合理性,以常泰长江大桥为工程实例,对塔柱偏心距增大系数进行了计

期刊

桥梁工程计算方法对比有限元偏心距增大系数斜拉桥桥塔

一种简单的神经机器翻译的动态数据扩充方法

反向翻译作为一种用于神经机器翻译的数据扩充方法,被广泛应用于单语数据的训练.然而,这些方法通常需要大规模源端或目标端单语数据、双语词典等.基于此,提出了一种在不引入

期刊

神经机器翻译数据扩充单词覆盖

基于第三方的政府与道路运输企业安全监管演化博弈

为探析第三方安全监管下政府和道路运输企业的行为策略演化规律,解决道路运输存在的安全监管不足问题.借鉴演化博弈理论,将政府监管成本及收益、道路运输企业成本及利润、政

期刊

交通工程道路运输安全监管演化博弈模型第三方安全监管

小学建筑线描、建筑写生初探

教师应蹲下身子去欣赏学生的画,用赏识的眼光去感受,让学生在线描创作中培养观察力、记忆力、创造力.促使学生主动学习、积极参与,营造民主、平等的美术学习氛围,让学生充分

期刊

线描画线条写生

融合篇章上下文有效识别的篇章级机器翻译

篇章翻译是近来兴起的研究热点,如何在翻译文档时充分利用篇章信息一直是该研究的关键点和难点.在篇章级机器翻译中,如何选取当前句的篇章上下文是非常关键的.虽然相关研究使

期刊

神经机器翻译联合学习篇章翻译

小学数学概念教学的策略研究

概念是数学这门学科用抽象的语言形式,向我们描述数学学科中数量之间的关系以及空间形式的本质属性等基本内容.教师一定要加强重视,结合目前概念教学中存在的问题进行研究和

期刊

数学课堂概念教学策略探讨

神经机器翻译的词级别正则化

与本文相关的学术论文