基于日语格语法表示的汉语生成系统

来源 :南京大学 | 被引量 : 0次 | 上传用户:hejizhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
论文从以格语法表示为基础的日语分析结果出发,讨论汉语生成问题.在863日汉翻译系统从实验走向实用的背景下,论文对现有的日汉翻译系统中从中间分析结果到汉语生成部分进行了仔细、深入的研究,总结和发现问题,并给出解决方案,从而提高译文的质量.论文的主要工作有:1.把汉语生成分为单词词义选择、格短语处理、语序调整、表层处理四个部分.针对每个部分的特点,详细描叙了各自的基本的处理方法和遇到的难点,并针对性地提出了处理方法.2.设计了基于格语法表示的中间分析结果到汉语的生成系统,包括:生成规则、生成词典以及生成算法.3.对汉语生成中的难点进行了分析、总结、归纳、和处理,利用已有的语法知识,优化和扩充规则系统,设计了一套行之有效的解决方案,并取得了较好的效果.4.把整个语料库中日语分析的中间结果和汉语译文互相对照,针对汉语生成的需要,详细分析了现有日语分析结果的种种不足,为进一步加强日语分析提供参考.
其他文献
学位
该文在对地理数据共享方法、CORBA理论进行深入分析之后,结合构件开发技术和OpenGIS的CORBA规范,给出了基于CORBA的开放式构件GIS系统模型,以实现地理信息系统互操作.最后设
在当今社会,由于网络技术、数字媒体技术等的蓬勃发展,人们越来越多的参与到数字媒体作品在网络上的发表以及传播活动中来,同时,数字媒体的形式也越来越多样化,包括图像、音频、视
该文采用了一种分布式的网络入侵检测体系结构,具有良好的分布性和可扩展性,并重点讨论了基于主机部分的实现.它将基于网络和基于主机的入侵检测技术有机地结合在一起,提供集
该文首先介绍了遗传算法的一些基本概念以及标准形式遗传算法中存在的一些缺陷,并分别分析了一点交叉、两点交叉、均匀交叉,以及存在的问题和造成这些劣势的原因.接下来,重点
随着信息化社会的到来,INTERNET/INTRANET的信息发布和电子商务得到迅速发展。对一个组织或企业来说,如何集成现有的、分布在不同地区的各种数据源,以实现统一的信息发布和信息共
在数据挖掘技术中,聚类技术是一种重要的技术,它的任务是基于对象的属性(维)值寻找识别为同类的组.聚类技术广泛地应用在统计学、模式识别和机器学习等领域中.该文在分析各种经
当前,企业需要将电子商务、ERP、供应链等系统进行整合,应用系统集成的关键问题包括以下几个:跨平台的资源的利用,应用的快速重构,数据交换.该文从ERP和电子商务的研究项目的
该文以自动指纹识别系统的处理流程为线索,详细地讨论了指纹识别系统及其若干处理算法,并重点讨论了指纹预处理的设计与实现.该文的自动指纹识别系统是集活体指纹录入与识别
本文详细分析了基于COM/DCOM/COM+的分布式对象技术原理,重点阐述了COM的线程模型、通讯协议和安全机制,给出了基于COM的软构件复用的形式化模型。详尽讨论了分布式系统中的负载