基于英汉平行语料库的机器翻译知识获取研究

被引量 : 3次 | 上传用户:FSFASF
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网信息资源的不断膨胀,人们可以通过互联网获取的资源也日益增加。目前世界上已知的语言约有3000多种,机器翻译及机器翻译知识的自动获取研究对人们突破语言障碍,充分利用互联网信息具有很强的现实意义。本文主要围绕以下几个方面进行了深入的研究:1)词汇对齐。词汇对齐是从英汉平行语料库中,根据已有的句子级对齐的语料库,挖掘出词汇级的英汉词对应关系。对机器翻译、语义消歧、翻译词典获取以及跨语言信息检索等都具有重要的意义。2)短语对齐。短语对齐能够反映出平行句对在短语级别上的对应关系,短语对齐也是机器翻译知识获取领域的一个重要研究工作。3)句法结对齐。句法结构对齐是对双语句法结构树进行分析和总结,提取出双语句子在句法结构以及句子成分上的对应关系。句法结构对齐的结果能够直接应用于短语对齐的工作中。4)机器翻译知识的应用。通过对双语平行语料库的知识挖掘,并且运用到机器翻译中,进行翻译前后的对比,可以看出机器翻译知识获取对机器翻译的质量的改善。研究取得的主要成果如下:1)在词对齐方面,我们提出了基于N-Gram语言模型的多词对齐算法,有效的解决了对于词对齐过程中存在的一对多和多对多的对齐问题。并且实现了一个有效的英汉、汉英双语翻译词典。2)在短语对齐方面,鉴于句子结构的复杂性,我们提出了分类短语对齐的思想,把短语对齐分成了名词性短语、动词短语、形容词性短语以及副词短语。实验结果显示分类词对齐能够很好的提高短语对齐的准确性。同时,设计了一个能够提取双语短语互译单元的系统。3)建立了一个完整的基于英汉双语平行语料库的机器翻译知识获取系统。
其他文献
人格的各种元素构建对于个体的成长有着重要的意义。高中阶段是个体身心发展的重要时期,而此时期也同样面临着艰巨的学习任务。高中学生的个性特征直接影响着其心理的健康发
<正>谓"乱世出英雄",东汉末年至整个三国,是中国历史上英雄辈出的乱世,而且各个阶层都有。从横扫天下的帝王,到走街串巷的医生,名垂青史的人物一抓一大把,几乎每一个在这个时
高校学生管理工作是高校学生工作中的重要环节,我们应根据目前高校学生管理工作现状,探索新形势下高校学生管理工作中理念的突破、思维的调整、运行机制的转变及管理模式的调
腊肉和香肠以其悠久的历史和特有的风味而成为中国传统肉制品的典型代表,是世界珍贵饮食文化遗产的重要组成部分。传统腊肉和香肠因其特有的营养成分和组织结构,蛋白质、脂肪
中国大多数民用机场采用了水泥混凝土道面即刚性道面。随着国民经济和航空交通事业的发展,交通量的增加更加迅猛,分析道面剩余使用寿命及其影响因素,有助于机场的运营管理和
城镇化是一个国家实现经济发展的必由之路,也是21世纪全球经济发展的主题之一。20世纪90年代以来,越来越多的经济学家认识到经济发展和城镇化是相辅相成、互相作用的。90年代
初中历史教学应从培养学生的核心素养出发,激发学生对历史课堂的兴趣,调动学生学习历史课程的积极性和主动性。教师应树立历史核心素养观念,培养学生的历史时空观念,对学生进
鸿都门学是东汉末年由汉灵帝发起创立的一所艺文机构,以尺牍、辞赋、鸟虫篆作为取材标准,大量招引才艺之士为官。由于遭到正统士人的激烈反对,鸿都门学虽然在迅速兴起之后,很
目的 探讨肺硬化性血管瘤(PSH)肝转移的临床特点、诊治和预后.方法 回顾性分析2012年7月郑州大学附属肿瘤医院收治的1例PSH患者临床资料.患者已签署知情同意书,符合医学伦理学
美国著名小说家司各特·菲茨杰拉德于1925年发表其代表作《了不起的盖茨比》。该小说一经问世,便奠定了菲茨杰拉德在现代美国文学史上的地位,使其成为20世纪20年代“爵士时代”