计算机辅助翻译记忆库TMX文件的自动生成机制研究

被引量 : 2次 | 上传用户:flytraker
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自从十六世纪蒸汽机问世以来,机器替代人工就一直是一个不可逆转的趋势,而以计算机为代表的信息技术的发展则更加强化了这一点。机器翻译,或称计算机翻译,是一种使用计算机来实现不同自然语言间相互转换的技术,其研究建立在语言学、数学和计算技术这三门学科的基础之上,既是一门新学科,也是一门结合了语言学和计算机科学等学科的交叉学科。人类产生使用机器进行翻译的想法由来己久,其历史可追溯至十七世纪时,哲学家如莱布尼兹与笛卡尔提出代码字的概念,在字和语言间建立起了联系。但“机器翻译”则是近100年才出现的新概念。时至今日,虽已历经70多年的研究探索,但机器翻译产出的译文质量仍无法达到能令人满意的程度。鉴于这样的现实,在20世纪70年代有人提出了现今被称为“翻译记忆(translation memory)"的概念,即充分运用数据库功能,将已翻译好的文本内容加以储存。日后遇到相似或相同的翻译文句,电脑会自动比对数据库中已有的译文并为翻译人员提供建议,让其白行决定是否接受、加以修订或放弃使用。较为著名的电脑辅助翻译工具包括OmegaT、Trados、Transit Wordfast、Logopor、Microsoft LocStudio、IBMTM/Win、Google Translator Toolkit等。这些工具通常需要与翻译记忆库(TM)一同使用,翻译记忆库由若干翻译记忆单元组成,每个单元均包含源语言的一个句段(segment)以及其所对应的译文。这些句段可以是文字区块、章节、一个或是数个句子、或是词语。随着互联网的普及,各类网上资源日益丰富,其中也不乏各类双语平行文本,特别是中英双语文本就更是数量巨大。本文试图通过计算机程序自动获取这些网络资源,并将之转化为标准的翻译记忆库文件(TMX),配合相应的翻译辅助工具使用。以求更好地发挥这些网络资源的作用,将简单重复的劳动交由电脑完成,使译者的精力集中于核心译文的产出,为翻译工作提供更大的便利。对于程序代码自动生成的TMX文件,本文还进行了进一步的测试,包括统计评估和问卷调查。测试结果证明了由代码自动生成计算机辅助翻译记忆库文件的可行性和有效性。
其他文献
明末女诗人叶小鸾堪为明清江南才女群像中的代表,以其充满传奇和悲剧色彩的人生对后世文学艺术产生了一定影响。因为个人和时代的种种原因,无论是生前还是身后,她都受到了无
介绍了铜铟镓硒柔性薄膜太阳电池的性能、优点以及应用范围;阐述了柔性薄膜太阳电池的国内外研究现状、发展趋势;特别介绍了柔性薄膜太阳电池的典型结构以及柔性衬底材料的要
随着电力系统和通讯系统容量的日益庞大,蓄电池组作为直流后备电源的重要组成部分,对其稳定性和可靠性提出了更高的要求,对这些无人职守站和机房后备直流电源进行日常的监测
在米黄色PP材料中经常会遇到如下情况:使用不同的助剂、不同的色粉体系、不同的改性PP配方体系在注塑过程中(特别是是注塑温度达到240℃以上)出现颜色变化的情况(米黄色体系
简要总结了聚光光伏(CPV)的原理、优势以及不同技术路线的特色。对于聚光光伏科技和产业的历史及现状以及所面临的机遇和挑战进行了必要的阐述,论述了发展聚光光伏对我国光伏
用HIOKI3551 电池内阻测试仪对大容量(> 100Ah)阀控式密封铅酸蓄电池的内阻及其影响因素进行了研究。研究表明,在10 h 率放电过程中,剩余容量高于50% 时,电池内阻变化不大(仅增大5% );并且内阻和放电时间可拟
实现单体电池内阻的在线实时监测,对提高直流系统的安全运行、提高供电系统的可靠性和自动化程度,有着十分重要的意义。对现有的几种直流系统蓄电池单体电池内阻测量方法如密
存量房是指已被购买或自建并取得所有权证书的房屋,相对于增量房而言。存量房一般是指未居住过的二手房,即通常所讲的"库存待售"的房产。本文通过对存量房市场的分析和对国家
以三相100 kW光伏并网逆变器为研究平台,阐述了并网逆变器的工作原理和系统结构,分析了并网逆变器的并网控制技术,提出一种基于坐标变换和正负序分离的矢量控制的软件锁相环
涂尔干是第一个以社会学家的身份系统地将道德、德育纳入自己的研究视野并将其作为自己整个理论中心的学者。涂尔干所有的教育思想都是建立在其关于教育社会功能的理论基础上