训练语料的不同利用方式对神经机器翻译模型的影响

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:djdyaqb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经机器翻译(NMT)是近两年刚出现的一种新型机器翻译方法,是一种端到端的翻译模型。目前,影响NMT模型效果的因素有很多,其一,当训练语料规模较大时,梯度下降更新方法会对机器的内存要求很高,因此大多研究工作中采用随机梯度下降(SGD)的方法来更新模型的训练参数,即每输入一定数量(批:batch)的训练样例,就利用局部的训练样例更新一次模型参数;其二,参数dropout可以防止系统训练时出现过拟合,提高系统泛化能力;其三,数据打乱(shuffle)也对翻译结果有着重要影响。因此,该文的研究内容主要是探索批、dropout和打乱这三个因素在训练神经机器翻译模型中对模型翻译质量的影响,并得出以下三条结论:一是批的大小将影响神经机器翻译(NMT)模型的收敛速度,二是dropout可以提升神经机器翻译模型的性能,三是数据打乱可以在一定程度上提升神经机器翻译(NMT)系统的翻译质量。
其他文献
随着电子商务在我国的不断发展,这也就带动了网上营销的发展,电子商务下企业营销模式,就是主要说网上营销与传统营销的相同点及异同点,网上营销也是企业的一种竞争手段,是通
颜文樑赴法留学期间(1928–1931年),以海外风景为绘制对象的数张小幅画作,是中国现代油画史上的上乘之作,反映出中国早期油画家在油画语言方面艰难而富有成效的探索。本文集
北京沙河高教园区控制性详细规划的重点是突出“资源共享”的规划理念,在宏观上对高教园区的空间结构进行有效的把握和控制,努力创建一种能够顺应高等教育发展趋势、适应未来
舞龙作为中华民族的优秀传统体育活动,是中华民族的象征,是中华名族传统民俗中最优秀的文化遗产。运用文献资料法、调查访问法、观察分析法、逻辑分析法,对安徽省宣城市郎溪
近些年我国在公路建设方面的资金投入逐年增多,因此全国各级的公路网建设也日趋完善。现阶段我国的公路主要是沥青材料的路面,这种路面确实有着很多的优点。一是可以减少车辆
目的 通过检测多发性骨髓瘤(multiple myeloma,MM)患者血清中IL-6与IL-27表达水平,探讨其在MM病情进展程度及疗效评价中的意义。方法 按照修订的R-ISS国际预后分期诊断标准,选
1976年7月28日,我不幸或“有幸”亲历了置24万多人于非命的唐山大地震。我家住在矿区工房,地震中是11度烈度的重灾区。石头垒砌的平房,硬是不明所以地没有倒塌,一家老少六口
目的观察中药茵陈蒿汤加减联合耳穴压豆治疗胃肠湿热型痤疮的临床疗效。方法 25例胃肠湿热型痤疮患者给予中药茵陈蒿汤加减联合耳穴压豆治疗。结果临床痊愈4例(16%),显效13例
预防性自卫是指一国在受到武力攻击前所进行的先发制人的攻击,它与国际法上国家在"受到武力攻击时"才能进行自卫的规定是不相符的。但是核武器和恐怖主义等新情况的出现对"受
<正>"黄金天然不是货币,但货币天然是黄金。"在当前金融危机背景下,采用实证分析方法,研判黄金价格走势,对于政府制定经济政策和居民投资理财,都具有重要意义。
会议