面向小领域的可信机器翻译技术研究

来源 :第十一届全国计算语言学学术会议 | 被引量 : 0次 | 上传用户:zx1112220
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前统计机器翻译的模型不断复杂、语料规模不断增加,但翻译质量仍是机器翻译实用化的瓶颈.在一些语料少、句子短、句式工整的小领域,可综合使用记忆库、词典、模板、规则、语言模型等资源,将基于统计和基于规则的机器翻译技术结合起来,实现小领域的可信翻译.本文使用层次短语模型,设计并实现了一个菜谱翻译系统.实验表明,本文设计的框架可有效利用多种资源在小领域上实现高质量的机器翻译.机器翻译是使用计算机将一种自然语言翻译为另一种自然语言的技术,是自然语言处理的热点与难点之一。本文介绍了层次短语模型的规则形式及解码算法、小领域的可信机器翻译资源,并对层次短语模型和粘贴规则等做了一些改进,然后实现了一个菜谱翻译系统,进行了实验及分析;小领域由于其语料少、句子短、句型工整等特点,可以实现标准化的翻译。但是由于小领域的语料较少,实现高精度翻译需要大量的细致的工作。未来还要使用本文提出来的框架,钊对小领域的不同特点,在多个小领域实现高精度的机器翻译。
其他文献
近年来,本体被广泛应用于信息集成、智能信息检索、自然语言处理等领域,本文研究了一种基于多特征表示的本体概念挂载方法.以中国大百科知识体系**作为本体体系结构,抽取网络知
住房公积金制度推行10多年,中低收入者的“购房难”并未明显缓解,反而被质疑日益滑向了实际操作中的“济富”    今年5月世界银行发布的一份《中国经济分析报告》中指出,中国城镇实行的住房公积金,可以用来为中低收入群体提供能承受的住房融资,但主要是使收入较高的家庭受益,大部分非正规就业或失业的中低收入者无法参加公积金,实际从中受益的群体,是城镇人口的一小部分。    公积金贷款为何被收紧    9月4
2008年11月上旬,“三晋国家历史文化名城老年书画联展”在代县展出。代县老年书画研究会根据代县一本《摄影集》的前言复印了代县的历史简介,分发于大同、平遥、祁县、新绛县
应用X射线荧光光谱仪(XRF)研究了不同温度(120℃、400℃、600℃)提质后的粉化褐煤中主要成灰元素的梯度分配特性.结果表明:Si、Al元素含量随粒度级的减小而降低,不易向粉化产
管幕施工会对管道周围的土体产生扰动,引起土体移动。分析了管幕施工的地面变形机理,对顶管施工引起的地面变形计算方法的发展概况及研究进展进行了综述,将地面变形计算方法
领域本体是表达领域概念及概念间关系的知识集合,在知识共享、信息检索等方面有着重要的应用价值。目前领域本体的构建方法主要分为手工构建、全自动构建和半自动构建,其中半自
会议
语义相似度计算是自然语言处理领域的关键问题之一,在信息检索中的查询扩展、机器翻译中的模块识别,以及句法分析、词义消歧等任务中都发挥着重要的作用.本文将集成方法应用
会议
该作者报告台湾东部土著人村落中普通人群TTV- DNA流行率为 11% (34/ 317) ,与日本献血员的感染率 (12 % )相似 ,其中男性为 11例 (8.4 % ) ,女性为2 3例 (12 .4 % )。两性之
《现代维吾尔语语法信息词典》是为实现维吾尔语的自动分析与自动生成而研制的一部机器词典.是维吾尔文信息处理的支柱工程.在自动分析、自动生成、机器翻译、自动标注、自动
会议
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.