基于迁移学习的汉越神经机器翻译

来源 :厦门大学学报:自然科学版 | 被引量 : 0次 | 上传用户:pettey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对汉语-越南语(简称汉越)平行语料受限的问题,提出了一种基于迁移学习的汉越神经机器翻译(TLNMT-CV)模型.在训练汉语-英语、英语-越南语的翻译模型的基础上,通过迁移学习方法,利用训练得到的汉语端编码器和越南语端解码器,分别对汉越翻译模型的编码器与解码器参数进行初始化,并使用小规模汉越语料进行微调优化,得到TLNMT-CV模型.实验表明,TLNMT-CV模型能够快速地实现新模型的初始化,提高模型的参数质量,从而提高翻译性能.相比Transformer,TLNMT-CV模型的双语互译评估(BLEU)值
其他文献
目前我国的刀具管理软件虽然在一定程度上能够满足刀具管理的业务需要,但刀具管理系统普遍缺少对刀具三维模型的图形处理能力,影响到对刀具的有效管理与使用.为减少刀具实际
针对现有的仅可察觉差异(just noticeable difference,JND)模型未能考虑水下图像特有的颜色选择性衰减的问题,提出一种基于水下图像的JND预测模型.该模型考虑光在水下特殊的吸收和散射特性,设计水下图像特征提取模块,建立基于特征提取模块的全参考水下图像损伤感知网络,并将其命名为感知有损/无损预测器,用于预测畸变图像相对于参考图像而言是否有感知上的损失.进一步采取基于反馈的搜索
树形分子因其具有独特的树枝状分子结构以及多价协同作用等特性在生物医学领域具有广阔的应用前景。然而树形分子合成繁琐费时、纯化困难,使得大规模制备高代无缺陷的树形分
右心衰竭(right heart failure,RHF)是一种复杂的临床综合征,发病机制多样,致残、病死率高。目前对右心衰竭的研究远落后于左心衰竭,右心衰竭的有效治疗方法匮乏,建立可靠稳
在基于深度网络的工业板材表面缺陷检测应用中,缺陷图像的类别不平衡和数量不足严重制约了深度网络的应用性能.为了解决此问题,提出一种基于同类融合的工业数据扩充方法以丰富表面缺陷图像训练集.首先根据缺陷特征将表面缺陷图像集中的样本进行分类,随机选择属于同一类别的多个样本执行融合操作以扩充数据量和丰富样本类型,然后将原始数据和扩充的人工数据组合起来作为新训练集,以提升模型分类和检测的能力.以实际生产中采集
冠状病毒是人和动物的重要致病原,其中新型冠状病毒肺炎(coronavirus disease 2019,COVID-19)给人类健康带来了致命威胁。宿主固有免疫反应是宿主抵抗病原体入侵的第一道防线
内源性活性醛可影响细胞生长、存活、代谢、炎症、氧化应激等多种生理病理学反应,引发“醛损伤”,进而参与心血管、神经、消化、呼吸等多系统疾病的发生、发展过程。本文就醛
对超高层建筑、超大跨度桥梁和高速铁路等重大工程进行有限元动力分析时,由于结构的模型非常大,自由度数有数千万,计算成本往往非常高,计算效率比较低.虽然数值子结构方法能