统计机器翻译判别式训练方法研究

被引量 : 0次 | 上传用户：sddxfg

【摘要】

：

过去二十多年，统计机器翻译取得了很大的成功；但是它还远不能满足人们的需求，它仍然需要进一步的发展和改善。在当前的形势下，从数学模型的角度来看，统计机器翻译的一个发展趋势就

【作者】

：

刘乐茂

【发表日期】

：

2013年期

【关键词】

：

统计机器翻译对数线性模型判别式训练极端保守更新特征分组局部训练可加型神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

过去二十多年，统计机器翻译取得了很大的成功；但是它还远不能满足人们的需求，它仍然需要进一步的发展和改善。在当前的形势下，从数学模型的角度来看，统计机器翻译的一个发展趋势就是，从少特征、小模型到多特征、大模型的过渡；从线性到非线性模型的演变。按照翻译模型这个发展趋势，本文从目前最主流的对数线性翻译模型出发，以判别式训练作为主要线索，主要研究了如下四个方面的内容：（1）对于含有少数特征的对数线性模型，现有最成功的判别式学习算法MERT遭遇了不稳定性。由于在每次优化步k-best翻译列表会发生变化，这就意味着定义在k-best翻译列表之上的优化目标函数会发生变化，从而引起优化权重的“震荡”现象，同时引起了MERT的不稳定性。本文在设计判别式训练的优化目标时，采用了极端保守更新的思想来抑制优化权重的“震荡”现象，提出了基于极端保守更新的最小期望错误率训练方法。该训练方法采用基于梯度投影的学习算法来实现，因而它的实现比MERT简单。实验表明，这个训练算法的性能比MERT更好。（2）对于含有大规模稀疏特征的翻译模型，虽然现有的可扩展的训练方法从训练效率上来说，能够勉强运用于训练这样的翻译模型，但是这些训练方法由于遭遇严重的特征稀疏性而导致翻译性能不佳。本文就特征稀疏性，研究了两个实用的应对技术-扩大开发集和L1正则，不过由于一些其他的原因，这两个技术并不足以解决特征稀疏这个问题。为此，本文提出了一个基于OSCAR的自动特征分组的训练方法。为了有效地学习特征的分组结构，本文提出了一个在线学习方法。实验结果表明，这个训练方法取得了比现有方法更好的性能。（3）基于对数线性模型的所有现有训练方法均存在如下两个不足：首先，它们的性能严重依赖于开发集的选择，而通常适合测试任务的开发集往往很难获得，这样容易导致由于采用了不合适的开发集进行训练，测试性能很差；其次，这些训练方法都是针对给定的开发集，训练出一个权重，而这个权重不能保证所有测试句子翻译结果的一致性。为了解决这两个问题，本文提出了一个局部训练的方法，与现有的方法明显不同，它为每个测试句子训练一个权重。局部训练方法的一个瓶颈是训练效率问题，本文提出了一个增量式的训练方法来克服这个瓶颈。需要强调的是，从测试时的决策函数来看，局部训练方法对应于一个非线性翻译模型。（4）基于对数线性的翻译模型，在建模翻译现象时，存在如下两个局限性：它严格要求特征同模型函数之间的线性关系，容易引起建模的不充分；不能对于其中的表面特征进行进一步的抽象和解释。采用神经网络对于翻译进行建模是缓和上述问题的一个潜在途径，一方面，神经网络可以突破线性的限制，能够逼近任何的模型函数，因而建模更充分；另外一方面，它通过引入隐含单元，可以对输入的表面特征进行抽象和解释。不过，如果将翻译的建模同它的解码联合在一起进行考虑的话，经典的神经网络由于它的一些特性，会遭遇严重的解码效率问题。为了解决这个问题，本文提出了一个变化的神经网络-可加型神经网络，来对翻译进行模型，同时本文为基于可加神经网络的翻译模型提出了一个有效的训练方法。

其他文献

新生仔猪低血糖症的发生原因、临床症状、剖检变化及防治措施

新生仔猪低血糖症是常见的一种新生仔猪疾病,主要特征是血糖浓度急剧降低,且脑神经机能发生异常,通常是小于1周龄的仔猪易发,其中发病率最高的是2~3日龄仔猪,发病率能够达到3

期刊

新生仔猪低血糖症发生原因临床症状剖检变化西药治疗中药治疗饲养管理

基于改进PCNN的压缩感知域图像融合

提出了一种压缩感知域基于改进PCNN的图像融合算法。根据压缩采样得到待融合图像的压缩观测值,建立改进PCNN模型,即利用压缩观测值的物理意义对PCNN中连接系数,加权矩阵和特

期刊

图像融合压缩观测值脉冲耦合神经网络自适应调节

糖皮质激素在急性脑水肿中的应用

糖皮质激素是60年代发展起来用于治疗外伤性脑水肿的药物,其中以长效糖皮质激素--地塞米松(Dex)为代表.90年代初,由于大剂量地塞米松概念的提出,在控制外伤性脑水肿发展方面

期刊

急性脑水肿糖皮质激素细胞毒性脑水肿

情节记忆的神经科学研究综述

情节记忆包括主观时间感、自主意识以及自我三个中心成分.从1972年提出到现在,已成为记忆研究中的一个热点.该文从对情节记忆与语义记忆划分的质疑切入,论述了支持这一划分的

期刊

情节记忆语义记忆编码提取

绿洲灌区不同密度玉米群体的耗水特性研究

【研究背景】水分作为作物产量的主要限制因子,如何高效利用有限水分资源成为我国农业可持续发展面临的重大课题。纵观前人研究,关于密植效应可增产、密植可提高水分利用效率

会议

玉米密植耗水结构产量水分利用效率

议论、文字、才学——再论苏东坡、黄山谷诗格之异同兼及宋诗的发展

苏轼主要是“以议论为诗”，黄庭坚主要是“以文字为诗”，而两者却都是“以才学为诗”。苏开直抒胸臆、肆口满心、天才性灵之一派；黄开苦吟学力、锤句炼字、点铁成金之一派。虽宋

期刊

苏东坡黄庭坚宋诗诗派

右心房功能的评价

与左心房相似,右心房据有储蓄、管道、辅泵三种功能。现将对一些疾病中,右房功能发生的不同改变进行综述,同时总结目前用于右心房研究的一些指标及方法。

期刊

超声心动图右心房功能

中西医结合治疗脑卒中后迟缓性瘫痪疗效分析

目的探讨脑卒中后迟缓性瘫痪患者中西医结合的疗效。方法将60例脑卒中后迟缓性瘫痪患者随机分成A、B、C 3组,每组20例,A组静脉注射脑生素;B组通过电针、促通治疗;C组则采取中

期刊

脑卒中迟缓性瘫痪中西医结合促通电针脑生素

创维智慧家庭设计理念和场景模式解析

介绍了创维智慧家庭设计的理念,使用Z-Wave和Zig Bee通信的智慧家庭系统,结合NFC、蓝牙和Wi Fi等辅助无线连接技术,采用模块化的设计思路,可以推动标准的统一,兼容更多的设备

期刊

智慧家庭模块化设计场景式应用

银杏复合系统碳储量及土壤碳循环过程研究

农林经营措施对系统碳固定有着显著影响。开展复合经营系统固碳和碳循环的研究，对全面分析和评价银杏复合经营生态系统的固碳价值有着重要的意义。本文以江苏省泰兴市不同银杏

学位

银杏复合经营碳储量土壤碳循环土壤有机碳组分土壤生物活性

统计机器翻译判别式训练方法研究

其他学术论文