基于深度神经网络的统计机器翻译模型研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:usercmd1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网应用的日益增多,网络交互愈加频繁,互联网内的资源呈现出爆发式的增长。在此浪潮的冲击之下,深度学习等基于大规模数据的方法被提出,且对于许多搁置不前的经典任务,学者们开始从全新的角度加以思考。而本课题的研究方向就是对传统的机器翻译问题重新设计与建模,并使用深度神经网络来解决此问题。通过对传统统计机器翻译方法的调研,以及深度学习在自然语言处理中的应用分析,本课题旨在建立一个联合的神经网络模型来覆盖整个翻译过程,从End-to-End的角度直接完成翻译任务。以往对于机器翻译模型的改进,通常是将其中某个子模块使用神经网络进行替换,但本课题联合所有子模块进行建模,把机器翻译过程分解为编码器、解码器两大部分。在此之上对语言模型、词对齐部分、以及输出模块生成算法进一步优化,并提出一种基于递归神经网络的RNN-embed机器翻译模型。此模型最大的优势为无需对双语数据进行分词处理,平行双语对会被视为两个高度相关的具有时间顺序的序列对。双语数据以字符级别输入所提出的网络进行训练,以解决文本类信息在深度神经网络中高语义难处理的困难。基于所提出的模型,本课题还实现了一个可插拔的通用机器翻译框架,并以多线程及GPU计算加速训练过程。由于没有合适的公开数据集,便通过爬取字幕网站上的中英字幕数据,并预处理后生成一千多万对双语语料,部分作为实验数据使用。最后,通过实验验证,相比于权威统计机器翻译系统Moses,本课题的RNN-embed机器翻译模型大幅度缩减模型训练时间,同时降低翻译过程的复杂性。且与最佳的基于神经网络的机器翻译模型比较,本模型解决了基于分词的输入数据所存在的字典过大问题,并进一步提高了长句的翻译效果。
其他文献
随着深度学习和人工智能的发展,机器翻译方法渐渐由统计机器翻译法全面向神经机器翻译法转变。高性能神经网络模型在机器翻译领域中更大规模的应用,使机器翻译效果得到了巨大
结合教学实践,对在生物学专业开设生物信息学课程的必要性及具体的教学实施作初步探讨,为生物信息学课程教学提供参考。
目的了解消化系统恶性肿瘤患者术前营养风险与术后并发症的相关性。方法以消化系统恶性肿瘤患者170例为研究对象,对其进行术前NRS2002营养风险筛查及术后并发症调查,分析营养
本展的缘起2012年8月,借"中德文化年"在德国举办的东风,我与德国学者阿克曼先生共同策划的"墨变:中国当代水墨艺术展"在德国汉堡美术馆成功举办。由于这个展览既集中展示了与
在2015年企业所得税汇算清缴工作中,固定资产加速折旧税收优惠项目成为纳税人填报所得税申报表的焦点问题。由于固定资产加速折旧涉税政策多而繁杂,容易产生认识上的误区,影
采用光-微热量-荧光光谱联用系统获取了g-C_3N_4@Ag_3PO_4光降解罗丹明B(RhB)的原位热/动力学信息和三维荧光光谱信息,并结合热力学和光谱学结果探究了光催化降解罗丹明B的微观
依据实际教学效果和教学经验,结合《化工设计与技术经济分析》课程及课堂教学的特点,就如何对教学内容的安排、教学手段和途径的改进、提高课堂教学质量等方面进行初步探索.
语言和思维是密不可分的,人的语言表达是受思维方式支配的,英汉思维模式的差异使得英汉句型结构差异较大。因此,研究英汉思维特点,弄清其对句型结构的影响,对外语教学具有十
10月10日,来自杭州市16个区(县、市)、管委会的县级河(湖)长和治水办(河长办)业务骨干,以及14个市级河长联系部门代表,共80多人,来到浙江河长学院参加集中培训,以培训促管理、提成