论文部分内容阅读
翻译记忆(Translation Memory)作为一种计算机辅助翻译技术,经过三十多年的发展在理论和应用上已逐渐成熟。翻译记忆系统在全世界多种语言的翻译中得到应用,显示了良好的辅助翻译效果。国外关于翻译记忆技术的研究主要集中于翻译记忆检索匹配算法的研究,将翻译记忆与机器翻译、写作系统相结合应用的研究;国内则更多是关于翻译记忆系统的使用介绍。本论文试图从理论和实践两个方面讨论翻译记忆系统技术,主要研究内容如下:
第一,在对翻译记忆历史现状进行深入分析的基础上提出了第二代翻译记忆的基本概念,即数据加结构双层匹配的原则,并就相应的相似匹配算法和翻译记忆的库存结构进行了深入研究。利用基本的编辑距离计算方法进行多层次的相似度计算,实现了词汇、词性、句法层级上的多层次匹配;以TMX和TBX两个关键标准为基础,构建了具有语句结构信息的库存结构。
第二,基于所设计的翻译记忆库存结构和改进的相似匹配算法设计实现了一个试验性的第二代翻译记忆系统,在数据库中上利用改进的相似匹配算法进行了翻译记忆实验。最后以英语为源语言、汉语为目标语言,选择一定规模的语料对系统进行测试,并与具有代表性的开源和商用翻译记忆系统的输出结果进行对照评价,以探讨改进的翻译记忆库存结构和相似性算法的可行性。