融合句法知识和有限句对的无监督神经机器翻译研究

来源 :沈阳航空航天大学 | 被引量 : 0次 | 上传用户:nish2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经机器翻译训练模型需要充足的语料,利用深度学习的方法构建翻译模型,在低资源场景下双语平行句对数量不足,导致训练的翻译模型结果不符合标准。而无监督神经机器翻译技术使用两种语言的单语数据训练模型,改善了双语数量不足训练模型出现的问题。目前无监督神经机器翻译技术有完整的训练流程,通过对无监督神经机器翻译技术分析,本文提出问题和改进方法,具体工作有下两个方面。第一,无监督神经机器翻译使用Transformer训练翻译模型,虽然Transformer编码器结构可以通过自编码学习从句子中学习句法知识,但对于单语数据句法建模能力欠缺,本文提出利用去噪自动编码器语言建模功能将句法知识以不同的方式融合到无监督神经机器翻译的方法,使模型可以充分学习句子的句法信息,且证实了该方法的有效性。第二,在低资源场景下存在的少量双语语料不能用于模型训练,造成双语语料资源浪费。针对此问题,本文提出引入有限的双语平行语料辅助无监督神经机器翻译训练语言模型,并与句法知识结合训练模型,使语言模型学习源语言与目标语言单词之间的转换和句法信息,该方法有效的提升了无监督神经机器翻译的效果。最后,结合本文提出的两种改进方法,设计并实现融合句法知识和有限句对的无监督神经机器翻译系统,本系统调用无监督翻译模型完成机器翻译任务,并与基线模型作比较,结果表明有效提升了无监督神经机器翻译的翻译质量。
其他文献
随着智能交通系统越来越普及,车辆用户产生大量的数据需求。近年来,大量的研究人员聚焦于如何解决车辆用户获取请求内容的问题,但这些研究都缺乏不同网络环境对用户体验质量(Quality of Experience,Qo E)影响的思考。本文针对不同网络环境提出了网络质量好的环境下的智能化边缘缓存策略和网络质量差的环境下的智能化边缘缓存策略。首先,针对网络质量好的环境下车辆的高速移动性导致的车辆在基站之间
学位
随着互联网的高速发展及移动客户端的普及,人们越来越依赖于通过互联网来获取信息,文本信息过载问题日益严重,因此如何高效准确的获取信息变得尤为重要,文本摘要便是其中一个重要手段。本文在先前的研究基础上进一步探索,并提出了相应的改进算法,主要包括以下两个方面:(1)鉴于中文n-gram蕴含着丰富的局部上下文信息,本文提出一种将n-gram信息整合到现有模型的神经框架Ngram Sum。该框架以现有的神经
学位
动态对比增强磁共振影像(Dynamic-contrast Enhanced Magnetic Resonance Imaging,DCE-MRI)可以显示平扫影像中不明确的病灶区域,因此被广泛用于乳腺癌的早期诊断中。在检查过程中,患者的呼吸行为等会导致乳腺部位的形变,导致对于同层面不同时相的乳腺区域出现错位。此外,造影剂随时间的衰减也会对配准效果造成一定程度的影响。本文针对现有配准方法存在的准确率
学位
强化学习的深入研究推动了相关技术在无人驾驶、智能对抗等领域中的实际应用,并表现出了卓越的性能。但近年有研究指出,强化学习模型在实际使用中表现出不稳定的情况,既攻击者在模型的输入信息中注入扰动,从而使模型输出错误导致性能下降或决策失误。所以设计有效的对抗攻击是构建鲁棒的强化学习模型必不可少的前提。对于对抗样本对强化学习模型的干扰情况,本文提出了全时攻击算法进行评估,探究了强化学习模型对于不同对抗样本
学位
近年来,导致危害人体健康的腹部器官病变和肿瘤的发病率逐年上升。腹部各个器官的体积与形态变化是腹部疾病的早期诊断指标,其主要诊断方式为计算机断层扫描技术。从人体腹部多组织CT影像中精确并高效地分割腹部器官能够提高医生诊断的准确度和效率。大多数基于深度学习的网络模型通常用来处理单器官的分割问题,其进行多组织分割任务时,会产生由于图像中含有大量无关背景、不同类型器官之间相互影响而导致的过度分割与分割准确
学位
随着城市安防系统的迅速建设,摄像机的数量指数上升,采用人工方法在摄像机集群中追踪行人更加艰难,所以基于深度学习的多目标跟踪方法取得了迅速的发展。本文主要研究了一种非重叠视域多摄像机场景下对多个行人进行跟踪的算法,将其分为三个子问题进行研究,并提出优化和改进的方案。首先,为解决行人跨相机视域时因视角、光照影响导致特征表达能力不足的问题,提出了一种适应跨视域的特征提取算法。该算法将IBN块嵌入分类网络
学位
随着信息技术的迅猛发展以及各种智能移动终端的普及,大规模的流式数据从各式各样的应用系统中不断产生和涌现,因此,针对流式数据的复杂事件处理技术成为了重要的研究课题之一,同时也受到了国内外研究者的广泛关注。然而在现有的复杂事件处理技术中,对简单查询模式下的复杂事件匹配处理方法都还存在着一定的局限性。针对现有的复杂事件匹配处理方法存在匹配代价高的问题,提出了一种在有序事件列表上选择更优匹配顺序进行递归遍
学位
在中国共产党百年的历史进程中,调查研究工作方法起到了重要作用,为党和人民事业的发展不断做出贡献。习近平将调查研究工作方法融入到了治国理政的实践之中,提出了一些新见解、新论断,指导党和国家在脱贫攻坚、党的建设等方面取得历史性成就。当前,中国迈入了新的发展阶段,在新时代和大变局叠加的时代背景下,需要继续以习近平调查研究工作方法为指引,围绕重点问题展开研究,为建设中国特色社会主义现代化强国明确方向。文章
学位
面对当今能源短缺和环境污染的问题,发展航空替代燃料成为航空领域的重要研究课题。乙醇作为一种清洁可再生的生物燃料,具有原料来源广泛、制备工艺简单等特点,受到了人们的广泛关注。燃料通过燃油喷嘴时的流动及雾化特性是影响燃烧室内燃烧特性的重要因素。离心式雾化喷嘴在航空发动机上得到了广泛应用,开展航空替代燃料在离心式喷嘴内的流动及雾化特性的研究对于推动航空替代燃料的应用具有重要意义。由于物性参数的差别,在航
学位
近年来,乳腺癌的发病率逐年上升,严重影响全球女性的身体健康。随着医学影像技术的快速发展,核磁共振检查成为乳腺肿瘤早期检查的重要方式。乳腺核磁共振图像包括T1加权成像与T2加权成像两种方式。T1加权像突出乳腺解剖结构,T2加权像突出乳腺病理结构。在临床诊断中,医生经常需要同时对T1与T2图像进行观察,不仅耗时而且容易出现误诊。而T1及T2加权的乳腺MRI影像配准可以实现信息互补,简化医生诊断的难度。
学位