神经机器翻译中的并行解码方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ychh1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器翻译是人工智能和自然语言处理研究中的一个重要研究领域,其目标是通过模型将源语言的语句自动转换为目标语言的语句,且保证二者具有相同的语义信息。近年来,神经机器翻译模型成为了该任务的主流模型。该模型基于序列到序列的框架,通过编码器将源语言的语句编码为固定维度的隐藏状态向量,之后解码器依据给定的源语句隐藏状态按照自回归的方式从左至右逐字地生成目标语句。神经机器翻译模型在多种翻译任务上都取得了巨大的成功,在大多数语向上超过了基于统计机器翻译的方法,在某些特定语向上甚至可以达到与人类翻译专家相近的水平。然而,在生成目标语句时,由于神经机器翻译模型采用了自回归的解码方式,使得其解码速度较慢,成为了在现实机器翻译系统中应用时的瓶颈。为了解决这一问题,研究者提出了基于并行解码的机器翻译模型。在生成目标语句时,这种模型不再按照自回归的生成方式逐字地生成,而是在每个位置上并行地生成目标语句,因此解码速度得到了显著的提高。但与自回归模型相比,由于预测时无法利用目标单词之间的上下文信息,并行解码模型的翻译准确度较低,阻碍了其大规模的应用。针对这个问题,本文对基于并行解码的神经机器翻译模型进行了深入研究,从模型结构优化、解码算法优化以及结合预训练模型等多个方面来提升并行解码模型的翻译效果,同时保持其在解码速度上的优势:1.从模型结构的角度,本文从两个角度进行了改进。首先,由于传统并行解码模型的解码器输入是对源语句的一个拷贝,蕴含的目标语句信息较弱,因此模型无法对解码器进行较好的优化。针对这个问题,本文提出了增强解码器输入的并行解码模型。通过在词元层级和词向量层级分别引入对源语句的转换,并将转换后的结果作为解码器的输入,该模型对解码器端提供了蕴含目标语句信息的输入,从而降低了解码器的优化难度。该模型在多个机器翻译基准数据集上均大幅超过了基线并行解码模型的效果,并能保证相对于自回归模型十倍以上的解码加速比。其次,考虑到并行解码模型和自回归模型的结构基本一致,本文引入了迁移学习来利用自回归模型中蕴含的知识提升并行解码模型的效果。由于二者之间的训练模式存在差异,简单地应用迁移学习效果不佳。因此,本文提出了基于课程学习的迁移学习方法,让模型可以在二者的训练模式之间实现平滑的转变,更大程度地利用自回归模型中的信息,并最终提升了模型的翻译效果。2.从解码算法的角度,为了实现翻译质量和解码速度的平衡,本文研究了基于迭代解码的算法。并且,为了解决并行解码模型中编码器端鲁棒性差和翻译结果中容易出现重复词的问题,本文提出了基于共同掩码的模型,对编码器和解码器同时进行掩码训练,并设计了相应的损失函数和解码算法。该模型在翻译效果上可以和自回归模型相媲美,同时也能保证五倍以上的解码加速比。3.从结合预训练模型的角度,本文探索了将预训练语言模型如BERT应用到机器翻译任务上的可能性。针对预训练语言模型微调时存在的灾难性遗忘、模型不匹配以及对学习率较为敏感等问题,本文提出了基于轻量级适配器的模型。在每一层预训练模型层之后插入轻量级的适配器层,在下游任务上微调时固定预训练模型的参数,只微调适配器层的参数。结合迭代解码的并行解码算法,该模型在翻译效果上超过了传统的自回归模型,同时在解码速度上也能保证一倍以上的解码加速比。
其他文献
石羊河是西北内陆河的典型代表,其保护治理经验对同类型河流治理有重要的参考价值。随着甘肃省全面推行河长制,石羊河“一河一策”方案应运而生。本文在分析石羊河流域水资源的利用和保护、水域岸线的保护和管理、水污染的预防和治理、河道内开采河砂、水生态环境、涉水行政监管等方面现状和存在问题的基础上,研究相应的目标任务,并提出具体措施和建议,为下一轮“一河一策”方案的编制和推动提供参考。
作为新时代国土空间规划体系下乡村地区的详细规划,村庄规划应逐步向“实用、管用、好用”的方向发展。本文通过对村庄规划发展及传统村庄规划面临的理论基础缺乏、参与热情不足、脱离村庄实际、建设实施困难等问题进行简要分析,明确新时期村庄规划定位,结合“好编”“好懂”“好用”等实用性村庄规划特征和村庄规划“五型”方法,从理念、体系、策略、组织、实施等五个角度出发,制定实用性村庄规划编制策略,开展创新思路,并以
国土空间规划体系中,实用性村庄规划是乡村地区的详细规划,已成为新时期农宅建设管控的法定依据.在梳理江苏省农宅建设管控政策演进基础上,剖析农宅建设存在的布局分散、空间扩张无序、农房风貌多样的现实问题.基于“多规合一”规划编制技术的约束,以江苏省乡村地区的规划实践作为实证研究案例,对农宅建设提出“宏观-中观-微观”空间维度嵌套的管控思路,实施“分类管控、边界管控、要素管控”的精细化管控方式,探讨实用性
建立一种快速准确高效的方法同时检测特殊医学配方食品中泛酸、烟酰胺和左旋肉碱的含量。试样中的左旋肉碱、烟酰胺和泛酸,经盐酸溶液超声溶解后,酸碱沉淀杂质,经Agilent Eclipse XDB-phenyl柱分离,以甲醇和0.1%甲酸溶液为流动相,梯度洗脱,流速为0.4 m L/min,柱温40℃,采用液相色谱-质谱法检测。结果表明,泛酸在0.2~1.5 g/m L,烟酰胺在0.08~0.5 g/m
随着社会生态形势的变化和国家出台各项生态保护、环境政策,将林业生态保护与天然林保护工作提到了不可忽视的地位。甘肃省小陇山林业生态保护与天然林受到了省内的高度重视和关注,分析和论述了小陇山林业实验局天然林生态保护工程的森林资源增加量、林业保护的具体措施和生物多样性保护及水土保持和涵养等多个细节角度。探讨了甘肃省小陇山林业和天然林实施工程概况、当今国内林业生态质量和天然林保护现状、林业生态保护与天然林
基于“扎根理论”的资料分析,目前高校课程思政育人的困境:教师对课程思政理念存在认知偏差;各类课程思政目标差异显著;课程思政协同育人乏力和其效果评价体系匮乏。基于此,文章从“扎根理论”分析结果出发,提出高校课程思政协同育人策略:提升教师课程思政价值认同;塑造专业课程思政教育目标;开发专业课程思政教育内容;构建课程思政育人体系。
目的:观察重组人表皮生长因子凝胶联合CO2点阵激光治疗烧伤及创伤后增生性皮肤瘢痕的临床效果与治疗安全性方法:根据随机数字表将所有患者分为单纯点阵激光治疗组和联合治疗各10例。联合治疗组使用CO2点阵激光治疗增生性瘢痕后术区外用重组人表皮生长因子凝胶治疗;单纯激光组使用CO2点阵激光治疗增生性瘢痕后术区不加用药物。两个月治疗一次,两次为一个疗程,记录一个疗程。每次治疗效果数据收集的时间点为下一次激光
<正>你想改写自己的人生脚本吗?如果有一支情绪温度计,“非常好”是10分,“非常差”是1分,你给自己打几分?蛤蟆先生打了1~2分,因为他觉得整个人都不好,甚至糟糕。爱冒险、喜欢耍酷的蛤蟆先生,是《蛤蟆先生去看心理医生》一书中的主角。蛤蟆先生一向是大家的开心果,他拥有一座从父辈那里继承来的大庄园,但没人会料到,一向大大咧咧的他会得抑郁症。他在朋友的建议下去看了心理医生,咨询过程中,他回溯了自己的童年
期刊
目的:探讨分析强脉冲光联合硫酸羟氯喹治疗玫瑰痤疮疗效观察及对生活质量的影响。方法:按随机数字表法将2020年7月-2021年5月六安市中医院收治的89例玫瑰痤疮患者分入对照组(45例)与治疗组(44例)。对照组采用硫酸羟氯喹片+盐酸米诺环素胶囊+医用冷敷贴治疗;治疗组在对照组基础上联合强脉冲光治疗。对比两组治疗前后症状积分和生活质量评分、临床疗效以及不良反应。结果:相比对照组,治疗组总有效率更高(
<正>"其实特别不愿意回忆这件事,太痛苦了。6年来,四任法官,数十次开庭谈话,来一次法院,心里的伤疱就撕开一次,血流不止。"韩某说完,陷入了短暂的沉默。外人看来,韩某斯文帅气,顶尖大学硕士毕业,有着很好的工作,有漂亮的妻子,可爱的孩子,着实令人羡慕,但谁又知道他的内心深处埋藏着一个如此令人心痛的故事。韩某说,他出生的家庭并不
期刊