基于混合策略的机器翻译方法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:l907603912
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器翻译是自然语言处理领域中的一个重要应用,它几乎包含了自然语言处理的所有技术。经过若干年的发展,机器翻译研究已经取得了很大的进展,出现了许多机器翻译方法并产生了很好的效果,但是,机器翻译质量仍然和人们的期望相距甚远。随着国际间交流的日益频繁以及互联网的迅速发展,现代社会日趋国际化,它使得人们对机器翻译的需求日益迫切。机器翻译不仅仅在满足人们的日常需求上具有重要意义,在学术领域,在商业、军事等领域,同样具有重要的意义。因此,机器翻译研究一直是自然语言处理中备受关注的一个研究课题。 由于自然语言的复杂性,一方面,人们对自然语言本身的规律还没有完全掌握;另一方面,现有的各种机器翻译方法、理论虽然解决了机器翻译的一些问题,但它们还存在很多的缺陷。本文结合作者若干年来对机器翻译研究的实践和体会,对机器翻译中的若干问题进行了深入的研究,其中包括机器翻译所面临的问题和现有机器翻译技术在解决这些问题时的优势和不足、机器翻译的体系结构和实现方法以及混合技术在解决汉语分词及汉语句法分析中的应用等。本文的主要工作有: (1)深入分析了机器翻译所面临的问题以及规则方法、统计方法和实例方法的理论背景和实现技术,并总结各种方法在解决不同问题上的优势和不足。在此基础上,提出我们研究机器翻译的基本思路和处理原则; (2)针对机器翻译面临的问题,结合各种翻译方法的优势,提出了一种基于多层次融合的机器翻译系统框架,该框架充分利用了现有一些方法的优势,在机器翻译的各个层次上把它们有机地结合起来。该系统框架中,各组成部分之间具有层次性、互补性、可扩充性和相对独立性的特点; (3)针对汉语分词交集型歧义这一汉语分词中的难点问题,结合规则方法和统计方法在解决此问题上具有的优势,提出一种规则和统计相结合的交集型歧义消歧混合模型,利用消歧规则库和二元统计语言模型对交集型歧义进行消歧处理; (4)研究了汉语分析相关的句法理论,提出一种层叠式的汉语浅层句法分析技术,它基于一种面向汉语分析的汉语短语分类体系,通过从树库中获得的短语构造规则进行各层次汉语短语的识别。
其他文献
本文在阐述数据仓库基本理论的基础上结合某运营商的具体案例说明了数据仓库技术在国内电信业的应用。本文首先从基础理论、建设原则、基本体系结构、关键技术等几个方面比较
在人类语言中存在着多种的书写系统writing system,这些书写系统大致可以分为两类:一类是水平书写,大部分的西欧语言和现代亚洲语言都属于这一类,例如英语、汉语等都属于水平
本文针对目前网络中信息检索系统所存在的不足,结合Agent技术对网络信息检索的智能化和个性化发展进行了研究.文章首先分析了信息检索的基本原理和基本模型;介绍了数据挖掘、
世界已进入了以网络为中心的计算时代,而传统的网络模式中存在的互操作性差,平台隔离等问题亟待解决。将Webservice技术和P2P技术结合是实现资源共享、交互通信、系统集成、协
本文主要研究针对构件化嵌入式操作系统的软件保护机制的设计与实现。在分析通用操作系统中的保护技术的基础上,针对构件化嵌入式操作系统的特点,提出了一种将安全级和保护域结
企业应用集成(EAI)旨在将企业中完成不同功能,彼此相互独立的应用系统集成起来,并且不需要对现有的系统做太大的改变就可以让它们之间方便的共享业务数据和业务处理流程。随
形式化方法中的模型检测技术是近三十年来最为成功的自动验证技术之一。对并发传值系统进行模型检测需要建立相应的抽象模型,带赋值的符号迁移图是一种广为使用的抽象模型。
在我国政府信息化建设过程中,各政府职能部门常常根据自身的情况和需要,建立了自己的信息和业务系统。这些业务系统往往是采用不同的技术标准、不同的软硬件平台,由不同的软件提
随着XML的应用越来越广泛,对XML的支持已经成为数据库系统功能的一个重要组成部分。本文在PostgreSQL的基础上,提出了一个全面支持XML的版本XPostgreSQL,并从XML文档的存储及
随着应用需求推动和相关学科技术的进步,GIS被应用到越来越多的行业和领域中,其中油气藏管理GIS也得到迅猛发展。但油气藏边界形状复杂,内部状况难以直接观测,因此进行精确描述其