论文部分内容阅读
机器翻译技术是解决语言障碍的有效途径,努力提供质量高、速度快的机器翻译服务一直是机器翻译研究追求的目标。随着国际间信息交流的日益增多和互联网的快速发展,这一技术愈来愈被社会所重视,经过50多年的曲折发展,机器翻译研究取得了许多突破,尤其是近年来计算语言学研究的发展为机器翻译技术的实用化铺平了道路。 然而,由于自然语言的繁杂性和表达的不规范性,单一策略的机器翻译方法难以取得满意的效果。同时,单一策略机器翻译方法本身也存在着不同程度的局限性,其自动翻译的译文质量还难以达到精确的水平。目前,机器翻译研究主要面临两个难题:(1) 译文质量难以满足高质量译文需求;(2) 知识自动获取瓶颈束缚了机器翻译系统的扩展能力,而知识库的人为扩展又增加了知识维护的困难。 针对上述难题,人机互动的多策略机器翻译系统(IHSMTS)提出了一种有效的解决方法。该系统在多策略机器翻译思想的指导下,通过融合基于规则和基于实例两种机器翻译策略,建立了实例模式知识表示方法,有效解决了基于规则机器翻译系统的知识获取难题;系统充分利用基于规则语言分析的启发信息,实现了智能化类比翻译处理,提高了机器翻译的总体译文质量。 本文针对类比翻译处理问题提出了启发式类比翻译处理机制,实现了IHSMTS系统对翻译记忆的有效重用。该机制充分发挥TM技术在知识表示和获取上的优势,以基于实例模式的类比分析与类比推理为基础,借助基于规则的语言分析能力,实现了智能化类比翻译处理,提高了类比翻译的译文质量。 针对语句相似度度量问题,本文提出了基于多层次特征的语句相似度度量方法。通过考察语句在词法、语法和语义等多语言层面上的相似情况,该方法综合评价两语句的相似度,不仅合理扩展了语句相似度的度量尺度,而且从局部和整体两个角度综合考察语句的相似性,有利于避免翻译实例的漏选和错选问题,从而提高了IHSMT系统HATM类比翻译处理的性能。在语句词法、语法和语义特征提取时,该方法借助了基于规则语言分析的启发信息,提高了语句相似度计算的准确度。 针对双语语句词对齐问题,本文提出了基于层次模板的双语语句词