基于Apertium平台的英语到林加拉语的机器翻译系统构建

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:solonxpl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,全球化已成大势所趋,其关键是在全球范围内以较短的时间共享信息。然而,世界上语言种类繁多。所以不同语言进行信息检索的要求使得机器翻译应运而生。机器翻译通过检索可以自动地将给定的语言翻译成另外一种。目前的工作主要采用基于浅层的转移规则进行机器翻译,将英语翻译成林加拉语语。Apterium是实施系统采用的平台,该平台由八个模块组成,分别是分析、转移和将英语生成为林加拉语。形态分析器执行分析过程,并在英文字典中进行查找。结构转移按照目标语言句子中的词序进行处理,并使用传输文件。词汇转移查找相应的双语词典进行翻译。形态生成器通过查找林加拉语词典生成林加拉语句子的正确形式。词汇选择规则的定义与结构转移规则的定义在相同的文件中完成。Apterium平台的目标主要是处理利比里亚半岛的罗曼语系。而这些语言的词汇进行变化时通常是以后缀的形式进行变化,所有模块在处理范式时使用的都是此结构。在林加拉语中,词汇的变化通常表现为前缀的变化。本文采用词汇单元的反向规格化去生成正确的林加拉语词汇。本文使用IBM提出的BLEU度量方法来评估所获得的系统,该评价方法根据一个300个英语句子的语料库进行评价。这些句子首先提供给人类翻译人员以获得参考翻译,然后送入系统进行翻译进而获得假设翻译。BLEU指标在假设和参考翻译中运行,最后获得了90.63%的准确度。
其他文献
目的:应用冷刀与钬激光进行输尿管狭窄内切开术治疗输尿管狭窄临床应用较为广泛,关于两种手术方式治疗输尿管狭窄的临床效果比较报道较少。本研究旨在探讨比较输尿管镜钬激光
目的探讨综合心脏康复治疗对冠状动脉硬化性心脏病(coronary heart disease,CHD)介入治疗术后患者的效果。方法 2009年7月至2011年3月便利抽样法选择广东医学院附属医院心血
牛顿发现万有引力定律有一个复杂、长期的演变过程。而不是那种广为流传的牛顿看到“苹果落地”就发现了万有引力定律。把牛顿的创作过程呈现给学生,让他们体验到科学发展过
氰酸酯树脂(CE)高度对称的三嗪环交联结构使其具有一系列优异的性能,比如高的耐热性和高的机械强度,极佳的介电性能,以及低的吸湿性和热膨胀系数等等,这些性能使得CE及其复合材料在电子封装,航空航天,通信卫星等领域具有非常广泛的应用前景。然而,CE的固化温度高,固化时间长,且固化后的CE具有高脆性,这些缺点严重制约了其在实际生产中的应用,因此为了更好的适应工业生产的需要,CE的改性成为一个具有重要意义
瑞士作曲家弗兰克·马丁的作品以对位技巧、音色、和音乐性格的变化多端而闻名遐迩。受晚期浪漫主义的感染,他的作品旋律细致柔美。虽然其晚期受勋伯格的十二音体系影响,创作
交互式电子白板是一种具有创新意识的信息教学技术,具有很多传统黑白、多媒体技术不具备的应用优势。在小学语文教学中使用电子白板,不仅有利于开发学生语文兴趣,还能够提高
目的调查护士的离职意愿、社会支持现状及其两者的相关性,为制定稳定护士队伍的有效措施提供参考。方法采用方便抽样法选取2所二级甲等医院的194名护士进行问卷调查,调查内容
渣浆泵是从所输送介质的角度划分出来的一个泵种,专指用来输送含有固体颗粒混合物介质的特种泵,广泛应用于各种工业领域。渣浆泵所输送介质具有较强的磨损性和腐蚀性,与清水