论文部分内容阅读
统计翻译方法已经成为目前国际上机器翻译研究的主流方法,但对于一个统计翻译系统来说,哪些因素是影响系统性能的关键因素,它们对系统性能的影响有多大,并没有相关的文献对此做详细的调研和分析.本文以基于短语的(phrase-based)统计翻译系统为例,针对影响系统性能的几个因素做了一系列实验,并对其进行了详细地分析.实验结果表明:影响基于短语的统计翻译系统性能的主要因素依次为系统模型选择的特征、训练语料的规模和预处理.