基于关联度和词对齐的双语组块获取研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:windcode2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
长期以来,机器翻译系统都是以词为语言翻译的基本单位。人类自然语言中词的使用非常灵活,在机器翻译处理中有很大的歧义性,这是导致机器翻译译文难以提高的关键因素之一。这就需要引入比词语粒度稍大的单位来进行翻译。 本文工作主要内容如下: 首先,引入了面向机器翻译的双语组块的概念,它是一种粒度介于句子和词语之间的双语语段,具有语义自足性、结构合法性和翻译转换的充分性等特点。本文阐述了基于双语组块的句法分析和类比翻译的思想及其在IHSMTS系统中的初步应用思想,并围绕着双语组块的获取展开工作。 其次,在单语语料库的基础上进行了单语组块获取的研究。其中,对常见的关联度函数进行了对比分析,提出了三种获取单语组块的方案,并基于动态增长机制实现了对单语组块的获取,最后对组块语法属性的继承和传递进行了探讨。 第三,在双语语料库的基础上进行了双语组块获取的研究。在单语组块获取工作的基础上,提出了基于统计和基于词对齐的两种双语组块获取模型。设计并实现了基于关联度和词对齐的双语组块获取原型系统,取得了较好的实验效果。
其他文献
近年来,随着科学的进步与社会的发展,并伴随着我国民航运输业的迅猛发展,使得飞行流量和复杂性急剧增大,对塔台管制人员的要求越来越高。因此对采用现代化手段训练塔台管制人员提
随着确定性通信和智能交换等关键技术的突破进展以及以太网速率的提高,工业自动化系统控制级以上的通信网络正在逐步统一到工业以太网,并正在向现场设备级延伸,实现控制系统
90年代以来出现的一种基于角色的访问控制RBAC(Role-Based Access Control)技术有效地克服了传统访问控制技术中存在的不足之处,可以减少授权管理的复杂性;降低管理开销;而且还
在人工智能(AI)的研究中规划是其较早的研究领域之一,可以追溯到60年代。由于其广泛的实用性,受到研究者的高度重视。目前人工智能规划已经成为人工智能领域中当前研究的一个
数据库管理系统是保护信息安全的关键。Secure-OSCAR作为国产大型数据库管理系统OSCAR的安全数据库版本,使用身份认证与访问控制、审计、加密及入侵检测等技术共同确保数据库
智能规划是人工智能领域一个重要的研究内容。在经典规划中,规划问题满足以下的假设:即初始状态是完全给定的,动作的执行效果是确定的,环境的改变总是可完全预知、完全已知的,这使
本文首先比较分析了当前主要的通信网维护管理模型以及主要的软件设计方法,重点研究了面向对象方法及面向对象建模工具UML对系统进行建模的必要性。然后对通信网综合化集中维
随着以Web服务为基础的面向服务的体系结构的发展,如何复合分布的、自治的Web服务以构建新的企业业务应用的问题已成为软件工程领域一个新的热点问题。 Web服务复合是指把
目前,在企业信息化建设迅速发展的同时,也随之带来了很多网络安全上的问题,如病毒、黑客攻击等。面对这些问题,防火墙是大家首选的安全防护方法。但是,防火墙在给企业局域网提供安
综合决策支持系统(synthetic decision support system, SDSS)是决策支持系统的一个重要的分支。它发挥了传统决策支持系统和新决策支持系统的辅助决策优势,实现更有效的辅助