日汉机器翻译系统中术语自动翻译技术的研究

来源 :沈阳航空工业学院 沈阳航空航天大学 | 被引量 : 1次 | 上传用户:csutouyang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
术语作为人类智慧的结晶,集中承载着特定领域的核心知识。随着信息时代的发展,术语学的各项研究,越来越成为人们关注的焦点。术语翻译作为术语学的研究热点之一,广泛应用于机器翻译、跨语言信息检索和双语词典编撰等领域。本文主要分析了日汉术语的特点,并对术语所在专利文献的国际专利分类号(IPC号)、日汉术语包含的汉字信息,以及术语中词之间的搭配信息等进行了详细研究,然后将上述信息作为特征与语言模型、翻译概率等特征融合,利用摩西解码器实现了基于多特征融合的日汉术语自动翻译系统。本文主要工作如下:第一,将术语IPC分类信息作为术语的领域信息特征加入到翻译模型中。术语的领域信息对术语的翻译具有重要的作用,因此本文对术语及其组成所在专利文献的IPC号和词频进行了统计,将该信息作为特征之一,参与翻译代价计算;第二,将日汉字形相似信息作为特征融入翻译模型中。本文主要提取了日语和汉语中含有的共同汉字信息,将其作为特征,辅助术语翻译中的译文选词,参与状态转移的代价计算;第三,将具有词搭配信息的相对条件熵信息作为特征,参与翻译模型计算。该特征主要与语言模型共同作用,加大区分翻译候选的优劣。实验结果证明,本文基于多特征融合的术语翻译方法具有一定的有效性,在实验中取得了很好的效果。另外,本文对基于柱搜索的翻译流程进行了深入研究,包括翻译候选短语表的生成、启发函数计算、搜索和剪枝策略、译文生成等算法等。最后,本文对术语自动翻译中各个特征对术语翻译的影响进行了总结,并对术语翻译的下一步研究做了展望。
其他文献
三维重建的工作主要分为两个方面,一方面是空间位置重建,也就是几何重建;另一方面是外观重建,也就是纹理重建。对于前者,目前的手段发展相对成熟;对于后者,作为三维重建的一个
近年来,RFID技术已广泛应用于生产、物流、交通、运输、医疗、防伪、图书管理、设备跟踪和资产管理等领域。但由于外部环境干扰和射频信号的不稳定性,RFID阅读器所产生的数据
硬度是材料的重要力学性能指标之一,它表示材料表面抵抗局部塑性变形和破坏的能力。近年来,随着人们不断深入研究与应用,硬度的检测在很多方面都取得了可喜的进展,研究出了几
近年来,计算机硬件的飞速发展为计算机仿真的发展提供了坚实的基础,计算机仿真已经在很多的领域得到了应用,成为对许多复杂系统进行分析、设计和评估时不可缺少的重要手段。
随着网络信息资源的急剧增长,人们越来越多地关注如何快速有效地从网络信息中,抽取出潜在的、有价值的信息,使之有效地在管理和决策中发挥作用。 搜索引擎(SearchEngine)网站
移动通信技术的蓬勃发展,给移动计算环境下的各项应用带来了前所未有的机遇,传统互联网上的各项应用纷纷向移动互联网迁移,但简单的迁移远远跟不上需求的增长,移动互联网上需
人脸图像质量对人脸检测,人脸识别等各种与人脸图像相关的系统的执行性能具有重大的影响。人脸图像质量评价与传统的图像质量评价有很大的不同。本文针对人脸图像质量评价所
随着计算机技术的发展、计算机网络的普及和教育信息化水平的提高,国内众多高校创建了网络教学平台,但其主要功能是网络教学,不是专门的课程考试平台。为了适应新型的教学考
现代的媒体教学论和建构主义教学理论强调学习是学习者和环境之间的相互作用,并且环境对获取知识的意义构建有非常重要的意义。虚拟现实技术作为在网络技术和多媒体技术之后
随着因特网的不断发展,Web的信息量也与日俱增。面对如此海量的信息,如何保证信息的全面,及时和准确性成为搜索引擎领域所研究的主要课题。虽然通用搜索引擎在量上有很大的优