论文部分内容阅读
提出基于双语合成语义的翻译相似度模型,通过在翻译过程中引入双语语义相似度特征提高翻译性能。首先利用分布式方法分别在源端和目标端获取短语的单语合成语义向量,然后利用神经网络将它们映射到同一语义空间,获得双语合成语义向量。在该语义空间,计算源语言短语和对应的目标语言短语之间基于合成语义向量的翻译相似度,将其作为一个新特征加入解码器。在汉英翻译NIST06和NIST08测试数据集上,相较于基准系统,基于双语合成语义的翻译相似度模型获得0.56和0.42 BLEU值的显著性提高。