论文部分内容阅读
格式转换特指广义作用句各主语块位置的不同排列组合方式。由于汉英广义作用句格式表达的差异,汉语句子翻译到英语时常常发生格式转换。格式转换是HNC机器翻译理论的一个重要内容,是整个机器翻译理论实践的基础和前提。 本文以HNC机器翻译理论为指导,以真实文本的专利文献汉英句对为分析对象,从HNC角度研究专利机器翻译中汉英两种语言之间广义作用句的格式转换规则,包括排除规则、识别规则和转换规则,并设计程序实现规则和评估规则效果。 本文的研究范围包括“把、将、对、向、给、由、比、与”8个语言逻辑(lo)概念的格式转换,既研究单句中的格式转换,也研究句蛻中的格式转换。 本文的主要工作包括以下几个方面: 1.收集汉英专利格式转换语料,标注格式转换的现象、依据、结果和规则。参与建设知识库资源,包括词汇层面的知识和句子层面的知识。参与定义规则符号以及形式化规则。 2.研究格式转换的排除规则,参考《现代汉语词典》(第五版)分析“把、将、对、向、给、由、比、与”8个词不作语言逻辑(lo)概念的情况。 3.研究格式转换的识别规则,即识别(lo)的层次、找回EL、划定句蛻边界、识别句蛻类型。 4.研究格式转换的转换规则,包括单句中格式转换的转换规则和句蛻中格式转换的转换规则。 5.设计与实现格式转换程序,本文的程序使用标准C/C++语言来实现,以面向对象的思想来设计相关的类和方法。主要模块包括:载入待处理的文本、载入规则文本、排除非(lo)概念、识别(lo)的层次、找回EL、划定句蛻边界、识别句蛻类型、格式转换结果。 6.随机抽取部分语料对部分规则进行了人工评测,并对评测结果进行了分析。