论文部分内容阅读
本文的主要内容是面向俄文信息处理的机器翻译实验研究。一般而论,要研制实用的机器翻译系统,必须要有一套完整的、逻辑性强的、适用于计算机处理的翻译理论体系。然而,通过研究俄罗斯机器翻译的历史与现状,探索机器翻译系统设计的语言学保障和程序保障,我们发现,目前国内外还没有一套比较成熟而有效的俄汉机器翻译理论。因此,如何提高俄语文本尤其是军事文本的机器翻译正确率,将是本课题研究的重点和主攻方向。在对国内外基于规则的俄汉机器翻译软件实际使用后,我们发现,如果继续沿用传统的基于语法规则的自动翻译方法,要想大幅提高俄语军事文本翻译的准确率是相当困难的。通过将几种机器翻译方法进行对比分析,我们认为,从工程实施的角度来看,以翻译记忆(Translation Memory, TM)技术为核心的计算机辅助翻译应该是最佳选择。一方面,军事文本在词语、句型、结构等方面相似度高,术语和语句的重复率大,这正是可以发挥TM技术优势之处;另一方面,军事文本的翻译对于时效性和准确率要求较高,这是其他翻译形式所无法胜任的。本文的主要学术价值在于:系统介绍了俄罗斯机器翻译研究的历史与现状,客观分析了机器翻译未来的发展方向,提出了基于TM的计算机辅助翻译系统的核心技术和实现方法。本文的研究将有助于拓宽机器翻译应用研究的范围,提高现有机器翻译系统的性能,为研制开发军事用途俄汉机译系统积累一定的经验。论文由绪论、正文四章、结论和参考文献组成。绪论部分主要介绍论文的选题动机、研究的目的和意义、学术新意及语料来源等。第一章“世界科学计算机化语境下的机器翻译研究概述”,首先对翻译与机器翻译进行界定,然后概述机器翻译研究的历史与现状,详细介绍机器翻译研究的几种基本方法。第二章“苏俄机器翻译系统解析”,首先扼要介绍《意思?文本》语言学模型理论,然后通过对几个典型机器翻译平台,包括ETAP系统、RETRANS系统以及LINGTON系统进行解析,指出各个系统针对俄文信息处理积累的经验与存在的不足。第三章“机器翻译系统评价”,首先概述机器翻译评价的理论与方法,然后运用机器翻译评价的相关理论,以机器翻译的在线资源为手段,对包括俄汉译通在内的三个俄汉机器翻译引擎进行综合评价。第四章“俄汉军用文书机器辅助翻译系统的设计与实现”,根据军用文书的语体特征,揭示基于TM技术的机器辅助翻译的优势,论述研制此类系统的语言学保障和程序保障。结论部分对本论文的理论与应用研究成果进行总结,指出尚待解决的问题。