论文部分内容阅读
随着社会的发展,人们对机器翻译的需求越来越显著,而现有的自动翻译系统难以满足人们的需求.自90年代以来,随着Internet的飞速发展,语料库语言学得到了越来越多的重视,诞生了两种新的数据驱动的机器翻译方法,即基于实例的机器翻译和基于统计的机器翻译.基于实例的机器翻译(EBMT)是一种经验主义的方法,它借助系统中已经翻译过的句子来翻译输入句子,用匹配、对齐和生成的过程来代替传统RBMT的分析、转换、生成过程.EBMT方法构造代价小,译文质量高,尤其在受限领域显示出了强大的活力.EBMT按照所存储实例的粒度不同可以分为4种类型.它们是翻译记忆,基于词表层的EBMT,基于模板的EBMT和基于结构的EBMT.实例的粒度越小翻译结果越精确,但对真实文本的覆盖率也越小;实例的粒度越大对真实文本的覆盖率就越大,但准确性就越小,而且不同粒度的实例对所要求的语言分析深度也不同.该文提出了一种基于实例的多层次机器翻译模型.该模型将四种EBMT有机的融合在一起,粒度小的实例在上层,粒度大的实例在下层,上层不能处理的句子交给下层处理.这样不同层次之间取长补短,达到了最充分的实例利用率和较好的翻译效果.该文对EBMT中的关键技术如:词对齐,相似实例查找,翻译模板抽取,基本名词短语识别,实例的运用等,分别进行了讨论并提出了自己的改进.该文还向读者展示了一个口语翻译系统——《口语翻译软件平台》.该平台就是"基于实例的多层次机器翻译模型"的一个具体实现.