融入语言学信息的神经机器翻译

来源 :苏州大学 | 被引量 : 0次 | 上传用户:jinghong_22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着全球化的进程,各国之间的经济文化交流日益频繁,在不同文化的碰撞与融合过程中,如何突破语言障碍,让机器完成不同语言之间的自动翻译,最终实现无障碍自由通信,是人们长久以来的梦想。随着深度学习的发展,神经机器翻译系统在翻译质量上取得了长足的进步,其综合性能显著超越了传统的统计机器翻译系统。神经机器翻译系统在对数据进行建模时,仅采用端到端的编码器-解码器框架,未结合丰富的先验性语言学信息。本文尝试将丰富的语言学信息融入到神经机器翻译系统的编码器-解码器框架中,探寻语言学信息的融入内容和融入方法。本文从单词级别,局部级别,句子级别的角度出发,由小到大,将语言学信息融入到神经机器翻译中,旨在提升神经机器翻译译文效果。在将语言学信息融入神经机器翻译模型的过程中:首先,本文从单词的角度出发,将单词的词性信息融入到神经机器翻译模型中,通过在目标端新增词性序列以及共享上下文向量,在解码阶段单词序列和词性序列联合解码,词性序列辅助翻译单词序列的生成,实验结果显示,融入词性信息的神经机器翻译方法可以提升机器翻译译文质量;其次,本文从句子局部级别的角度出发,将局部关联性信息融入到神经机器翻译模型中,通过在源端和目标端增加近邻关联指导,使得每个单词与其上下文更相关,实验结果显示,单独在源端和单独在目标端增加近邻关联指导的模型译文效果高于基准系统,融合源端和目标端近邻关联指导的模型译文效果明显优于基准系统;最后,本文从句子句法结构出发,将依存树信息融入到神经机器翻译系统中,并增加依存关联指导,构建长距离的句法关联性,实验结果显示,依存关联指导的增加较好地提升了神经机器翻译译文质量。综合本文的实验结果:从单词级别到句子级别语言学信息的融入,可以有效促进神经机器翻译性能的提升。
其他文献
分析了污泥的分类、特点,对环境的危害,以及现阶段国内外的处理方法。以西安市眉坞化工纸业废水处理过程为实例,详尽地探讨了污泥焚烧和燃煤锅炉掺烧的优缺点及其环境效益、
制备生物相容性好,靶向药物载体及特定环境响应释放的载药系统已成为纳米药物载体领域的发展新趋势。介孔二氧化硅纳米粒子比表面积大,孔体积大,孔径孔容可调,具有载药量高的
趣味田径教学法是基于学生学习兴趣的一种教学方式,是一种更加适合现代化学生发展要求和学习要求的教学方法。趣味田径教学法在高职院校的推行过程中,会遭遇一系列的难题,但
针对高职体育教学的现存问题进行分析,突出表现在教学方法较为单一,课堂交流相对匮乏等方面,且提出高职体育教学中趣味田径教学法的运用方式,以期能够不断提升高职体育教学的
目的回顾性分析北京协和医院224例活动期感染性心内膜炎(active infective endocarditis,AIE)手术治疗近中期效果。方法2012年1月至2017年6月手术治疗AIE 224例患者,男性154
物联网已被世界公认为继计算机与互联网之后的第三次信息产业浪潮。它是以互联网为平台发展起来的必然产物,是一种高科技产业,物联网用途极其广泛,其中智能家居是其中最具有
分析了液体雾化的微观和宏观过程,为了使FCC进料喷嘴取得较好的雾化效果,在喷嘴内部流道中,可采用多级雾化技术,对各级雾化蒸汽进行"矢量优化",确定各级雾化蒸汽的速度和喷出
在电话销售中心不断发展的今天,面对着复杂的经营与管理环境,企业的竞争日趋激烈,而关键的核心在于人才的竞争。但在日常的人力资源管理中,企业管理者仍然存在很多急需解决的
课堂话语是课堂研究的重要材料,既是教师进行教学的重要工具,又是学生学习语言的重要输入来源,对其进行实证研究具有重要意义。随着新一轮的中学课程改革的到来,阅读教学中的
目的:讨论低分子肝素对体外受精-胚胎移植技术(IVF-ET)中反复植入失败患者进行复苏周期移植的周期结局的影响。方法:选取2017年7月至2017年12月在盛京医院生殖医学中心行体外