论文部分内容阅读
解决汉维双语语料库机器翻译词语对齐引起的机器翻译问题,需要一个高质量的汉维双语语料库,而要建设这样一个双语语料库,其中关键的技术就是词对齐。本文针对规范汉语和维吾尔语双语语料库建设中词对齐进行了研究。新疆多语种信息技术开放课题组,双语平行语料库为机器翻译、双语词典编撰,以及自然语言处理领域提供了重要的资源,对它的研究有着十分重要的理论研究意义和实用价值。构建大规模的双语平行语料库是基于语料库研究的基础,而双语词对齐又是构建双语语料库的一个重要环节。因此,汉维词语对齐研究有着重要的意义。机器翻译是人类利用计算机进行语言之间的相互翻译,利用软件把文本内容从一种自然语言转移成另一种语言。自然语言的信息处理始于机器翻译实验。机器翻译即是检验各种语言理论的一个手段,也是促进语言研究的动力。随着人类进入全球化经济时代,人们对机器翻译的需求日益强烈,机器翻译迎来了一个新的发展机遇。随着社会的发展而产生的文献越来越多,如果依靠人力进行翻译既耗时又耗力。如果能够实现机器翻译,可以节省我们的时间和人力,这也是当今社会发展的需求。因此机器翻译成了克服语言障碍的主要手段。翻译是一种运用语言的活动,译者需要利用自己固有的知识对所翻译的内容分析加工,获得意义,然后再用符合译文语言习惯的语言表达出来。而机器却不能理解原文,它能做的只是机械转码,无法突破思维障碍,不可能译出与人译相同完整的文章来,要获得地道完整的译文需要经过人工修改,进一步完善和加工。机器翻译就是凭借计算机对信息进行处理,因此它就是一个自动化系统。“面向机器翻译的汉维词对齐规范”就是为了迎合时代的需求而形成的一项研究内容,本文以汉维词法为重点,力图使语言研究与高科技技术合成未来,服务于语言研究现代化。词在任何一种语言中都是非常重要要素,对汉维词法进行研究一直是热点问题也是难点问题。因此,在研究面向机器翻译的汉维词语对齐规范时首先,我们要对汉语和维吾尔语的词法进行进一步的研究和学习。初步的规范汉语和维吾尔语对齐规范。机器翻译的发展依存于语言研究,语言规则的研究是机器翻译的灵魂。