论文部分内容阅读
机器翻译(Machine Translation,简称 MT)是指借助计算机设备来完成自然语言翻译工作,例如:汉语翻译成哈萨克语或哈萨克语翻译成汉语。机器翻译有多种翻译方法和策略,但各方法都存在缺点和优点。其中基于实例(EBMT)的方法优点在于可以避免复杂的深层次的语法和语义分析,基于这种原因,本文使用了基于实例的方法。该方法对某个领域而言,容易实现具有翻译速度快,译文质量高,获取翻译知识简单的哈萨克语翻译系统。 本文首先介绍了哈萨克语/汉语翻译软件的设计和相关技术,实现了哈萨克语/汉语单方向文本翻译系统。 本文主要在几个方面做了探索:第一,描述了双语实例库建设过程,介绍了段落映射方法和实例句对齐方法,并设计了以数字和回车符为特点的段落对齐方法及句子长度和句子边界为特点的实例对齐方法,该方法在建设双语实例库中的应用减轻了人工对齐的负担和工作量。第二,为了提高实例搜索速度,本论文中设计了哈萨克语实例句词汇索引存储结构和索引生成工具,符合哈萨克语句子的相似度计算方法:相似片段重组研究。 本文对机器翻译理论方面做调查研究基础上设计了相应的哈汉翻译软件,并对此翻译软件性能做了小规模的实验,本软件运行效率与实例句相似度计算方法有直接的关系。从实验结果来分析看,对相似度高的句子来说可以获得高质量翻译结果;对其他句子来说翻译效率不是很明显,出现语法错误,语义不顺通等问题。