汉英机器翻译中汉语上下文语境的表示与应用研究

被引量 : 0次 | 上传用户:xdq2269586
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文面向汉英机器翻译,研究了汉语上下文语境的表示与应用,并将研究成果应用于汉英机译系统ICENT中。 在汉语句法分析和语义分析的基础之上,本文建立了汉语上下文语境模型CCM(Chinese Context Model,CCM)。CCM包括上下文语境知识的表示、获取和管理三个部分,构成了一个知识系统。依据上下文语境的动态变化性,CCM采用一种结构化的语义网络表示上下文语境知识,称为概念信息体关联网络CIURN(Concept Information Unit Relation Network,CIURN),并建立了动态获取上下文语境知识以及动态地管理和维护上下文语境知识的机制。CCM具有系统性、实用性、动态性、结构性和可扩充性的特点,其上下文语境知识包含句法信息、语义信息和句子之间的连贯信息,为分析汉语句子与上下文语境的关系提供了较好的支持。CCM将汉语上下文语境知识的获取与汉语分析纳入了同一个体系,建立了一种汉语上下文语境表示与应用的基本模式。 基于汉语上下文语境模型CCM,本文研究了汉语事件时间信息的分析、主语省略句的处理和名词短语的定指性判定问题。 本文建立了汉语事件时间信息框架TIFCE(Temporal Information Frame of Chinese Event,TIFCE),采用时制和时体两个元素描述了汉语事件的时间信息。基于CCM提出并实现了一种汉语事件时间信息分析方法,处理了汉语时间引用现象,获得了汉语事件的时间信息。该方法通过分析汉语时间短语的时间信息与时制,借助时间短语与事件之间的时间管辖关系,获得了汉语事件的时制;同时通过与汉语事件时体模板进行模式匹配获得了事件的时体。为给英语动词时态的正确生成提供信息,本文建立了汉英时间信息转换映射毛,将TIFCE中汉语事件的时间信息映射为英语动词的时态。通过对简化的新闻报道类汉语篇章语料进行实验,取得了较好的实验结果。 汉语篇章中主语省略现象给英语译文的主语以及其它句法成分的正确生成带来了许多困难,为此本文基于CCM提出并实现了一种汉语主语省略句处理方法。处理过程分为主语省略的识别和主语省略的恢复,提出了一种在汉语句子语义结构中识别主语省略的方法和一种从句法、语义和上下文语境多方面综合判断的“候选-选择”主语省略恢复策略。在实验语料中取得了较好的分析结果。 为判定汉语篇章中名词短语是否定指,为给英语译文冠词的正确生成提供信息,本文基于CCM提出并实现了一种汉语名词短语定指性判定方法。本文确立了汉语名词短语间的定指关系,提出了一种“候选-比较”汉语名词短语间定指关系建立方法,进而判定了名词短语的定指性。实验在名词短语为特指的条件下判断其定指性,验证了方法的有效性。 通过应用汉语上下文语境模型CCM及有关上下文分析方法,本文扩充了基于国防科学技术大学研究生院学位论文中间语言的汉英机译系统ICENT。原有系统主要以单句为对象进行句法分析和语义分析,扩充后的ICENT系统可对汉语句子进行上下文分析,其上下文分析分为三个子系统:时间信息分析子系统、主语省略处理子系统和名词短语定指判定子系统,主要解决英语动词时态的生成、省略主语的确定和定冠词的添加等问题。通过对ICENT系统原有中间语言进行扩充,在中间结构中表示了上下文分析结果,为英语生成提供了上下文语境信息。 本文建立了汉语上下文语境模型,研究了汉语事件时间信息的分析、主语省略句的处理以及名词短语定指性的判定问题,并基于上下文语境模型提出和实现了相应的上下文分析方法,取得了较好的实验结果。目前,这些上下文分析方法还只是在受限语料中进行了测试。在今后的研究工作中,我们将对汉语篇章语言现象及其分析方法继续进行深入的研究,进一步扩大适用语料范围,提高汉英机器翻译译文的质量。
其他文献
本文主要介绍了柑橘根线虫的识别,并且对柑橘根线虫的药物治疗提出了一系列相关措施,对药物防效对比实验做了简单的总结,方便供柑橘根线虫的治疗参考。以广西柳州鱼峰区雒容
上海动物园采用每半年疫苗免疫的方式防控野生禽类新城疫病毒( NDV )感染,然而,现用家禽疫苗和现行免疫程序下疫苗对野生禽类的保护效果尚不清楚。本研究初步探讨了新城疫疫
以香蕉和青头菌为原料酿制风味香蕉果酒,研究了青头菌汁液对香蕉汁酒精发酵的影响。实验结果表明,青头菌汁液对香蕉果酒发酵具有促进作用,最适条件为发酵温度30℃,果酒干酵母用量
通过对长白山针阔混交林,临江沼泽湿地和长春地区三种不同生境条件下蓝靛果忍冬生长发育及果实品质的调查分析,应用单因子回归与多元逐步回归和计算机技术,初步探讨了影响蓝靛果
通过仿真实验室进行装备保障研究,是提高综合装备保障能力重要途径。在装备保障仿真实验室功能需求分析的基础上,重点研究了装备保障仿真实验室的系统体系结构、运行体系结构和
为了准确预报我国钢铁工业未来生产结构、能耗和排放情况,构建了钢铁生产、加工、消费、折旧的全生命周期模型和基于人均钢铁存储量的产量预测模型,结合工序能耗和排放特征,
采用电化学、扫描电子显微镜、X射线光电子能谱等实验方法研究了1-羟基苯并三氮唑(BTAOH)和钼酸钠(Na2Mo O4)复配后对铜在ASTM D 1384模拟大气腐蚀溶液中的缓蚀协同作用.电化
目的探究乳腺癌易感基因1-mRNA(BRCA1-mRNA)水平及启动子区甲基化状态与乳腺癌患者临床病理特征的相关性。方法选取2016年2月至2018年2月于西安交大一附院确诊为乳腺癌的350
目的 通过检测子宫肌瘤中胰岛素样生长因子-Ⅰ(IGF-Ⅰ)及其受体(IGF-ⅠR)、雌、孕激素受体(ER、PR)的表达,推断IGF-Ⅰ在子宫肌瘤发生发展中的作用。 方法 采用免疫组化链霉
网络消费是网络营销诱导产生的一种新的消费方式,电子商务是从网络营销中脱颖而出的一种商业模式。电子商务打破传统的渠道形态结构,颠覆传统的消费者行为。网络消费呈现出与