基于混合策略的机器翻译方法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户：l907603912

【摘要】

：

机器翻译是自然语言处理领域中的一个重要应用，它几乎包含了自然语言处理的所有技术。经过若干年的发展，机器翻译研究已经取得了很大的进展，出现了许多机器翻译方法并产生了很好

【作者】

：

戴新宇

【机构】

：

南京大学

【出处】

：

南京大学

【发表日期】

：

2005年期

【关键词】

：

机器翻译混合策略多层次融合交集型歧义消歧混合模型汉语短语识别

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

机器翻译是自然语言处理领域中的一个重要应用，它几乎包含了自然语言处理的所有技术。经过若干年的发展，机器翻译研究已经取得了很大的进展，出现了许多机器翻译方法并产生了很好的效果，但是，机器翻译质量仍然和人们的期望相距甚远。随着国际间交流的日益频繁以及互联网的迅速发展，现代社会日趋国际化，它使得人们对机器翻译的需求日益迫切。机器翻译不仅仅在满足人们的日常需求上具有重要意义，在学术领域，在商业、军事等领域，同样具有重要的意义。因此，机器翻译研究一直是自然语言处理中备受关注的一个研究课题。由于自然语言的复杂性，一方面，人们对自然语言本身的规律还没有完全掌握；另一方面，现有的各种机器翻译方法、理论虽然解决了机器翻译的一些问题，但它们还存在很多的缺陷。本文结合作者若干年来对机器翻译研究的实践和体会，对机器翻译中的若干问题进行了深入的研究，其中包括机器翻译所面临的问题和现有机器翻译技术在解决这些问题时的优势和不足、机器翻译的体系结构和实现方法以及混合技术在解决汉语分词及汉语句法分析中的应用等。本文的主要工作有： (1)深入分析了机器翻译所面临的问题以及规则方法、统计方法和实例方法的理论背景和实现技术，并总结各种方法在解决不同问题上的优势和不足。在此基础上，提出我们研究机器翻译的基本思路和处理原则； (2)针对机器翻译面临的问题，结合各种翻译方法的优势，提出了一种基于多层次融合的机器翻译系统框架，该框架充分利用了现有一些方法的优势，在机器翻译的各个层次上把它们有机地结合起来。该系统框架中，各组成部分之间具有层次性、互补性、可扩充性和相对独立性的特点； (3)针对汉语分词交集型歧义这一汉语分词中的难点问题，结合规则方法和统计方法在解决此问题上具有的优势，提出一种规则和统计相结合的交集型歧义消歧混合模型，利用消歧规则库和二元统计语言模型对交集型歧义进行消歧处理； (4)研究了汉语分析相关的句法理论，提出一种层叠式的汉语浅层句法分析技术，它基于一种面向汉语分析的汉语短语分类体系，通过从树库中获得的短语构造规则进行各层次汉语短语的识别。

其他文献

数据仓库技术在电信业务经营分析决策系统中的应用研究

本文在阐述数据仓库基本理论的基础上结合某运营商的具体案例说明了数据仓库技术在国内电信业的应用。本文首先从基础理论、建设原则、基本体系结构、关键技术等几个方面比较

学位

数据仓库电信业务决策支持系统联机分析处理

垂直显示标记语言VHTML的设计与实现

在人类语言中存在着多种的书写系统writing system,这些书写系统大致可以分为两类:一类是水平书写,大部分的西欧语言和现代亚洲语言都属于这一类,例如英语、汉语等都属于水平

学位

垂直显示标记语言VHTML垂直显示书写系统万维网应用

基于Agent的网络文本信息检索研究

本文针对目前网络中信息检索系统所存在的不足,结合Agent技术对网络信息检索的智能化和个性化发展进行了研究.文章首先分析了信息检索的基本原理和基本模型;介绍了数据挖掘、

学位

信息检索Agent技术特征提取语义索引文本信息文本特征

基于代理的P2P网络访Web服务的研究与实现

世界已进入了以网络为中心的计算时代，而传统的网络模式中存在的互操作性差，平台隔离等问题亟待解决。将Webservice技术和P2P技术结合是实现资源共享、交互通信、系统集成、协

学位

JXTAP2P网络Web服务底层协议传输信息格式

构件化嵌入式操作系统TICK中软件保护机制的设计与实现

本文主要研究针对构件化嵌入式操作系统的软件保护机制的设计与实现。在分析通用操作系统中的保护技术的基础上，针对构件化嵌入式操作系统的特点，提出了一种将安全级和保护域结

学位

嵌入式操作系统软件保护机制二进制重写保护模型

一种基于JCA的企业应用集成框架的设计与实现

企业应用集成(EAI)旨在将企业中完成不同功能,彼此相互独立的应用系统集成起来,并且不需要对现有的系统做太大的改变就可以让它们之间方便的共享业务数据和业务处理流程。随

学位

企业应用集成J2EE应用服务器JCA资源适配器

一种扩展的并发传值进程抽象模型

形式化方法中的模型检测技术是近三十年来最为成功的自动验证技术之一。对并发传值系统进行模型检测需要建立相应的抽象模型,带赋值的符号迁移图是一种广为使用的抽象模型。

学位

形式化方法并发系统进程代数传值STGSTGASTGA~1验证模型检测互模拟检测

基于GIS的城市电子政务系统的建立策略——以攀枝花市为例

在我国政府信息化建设过程中，各政府职能部门常常根据自身的情况和需要，建立了自己的信息和业务系统。这些业务系统往往是采用不同的技术标准、不同的软硬件平台，由不同的软件提

学位

电子政务数据仓库分布式工作流地理信息系统

XPostgreSQL对于XML支持的策略

随着XML的应用越来越广泛,对XML的支持已经成为数据库系统功能的一个重要组成部分。本文在PostgreSQL的基础上,提出了一个全面支持XML的版本XPostgreSQL,并从XML文档的存储及

学位

XPostgreSQLXMLPostgreSQL模型映射XASSlideorderPath

GIS中图形表示技术

随着应用需求推动和相关学科技术的进步，GIS被应用到越来越多的行业和领域中，其中油气藏管理GIS也得到迅猛发展。但油气藏边界形状复杂，内部状况难以直接观测，因此进行精确描述其

学位

GIS图形技术向量代数不规则三角网等值线三维构造图

基于混合策略的机器翻译方法研究

与本文相关的学术论文