基于HMM的短语翻译对抽取方法

来源 :全国第八届计算语言学联合学术会议 | 被引量 : 0次 | 上传用户:Leichenglin8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在基于语料库的统计翻译方法中,基于短语的统计翻译与基于单个词的统计翻译相比可以更好地处理句中词语之间的关系,从而有效地提高机器翻译系统的性能.在基于短语的统计翻译方法中,一种重要的策略是把短语翻译对作为一种知识加入到翻译系统中,因此,整个系统的性能与使用的短语翻译对的质量具有很大的关系.本文在基于HMM词对齐方法的基础上,提出了一种从双语语料中自动抽取短语翻译对的方法,这种方法根据词语对齐时出现的不同情况作不同的处理,提高了短语翻译对抽取的效果.
其他文献
一个好的应用程序不仅要有强大的功能,还要有美观实用的用户界面.界面设计不仅是编程的问题,也需要一定的美学修养.本文基于Unicode编码的软件开发技术的研究基础上,对维、哈
本文介绍了作者在人民日报标注语料库分析上的一些经验,提供了相关的研究结果.采用统计技术对熟语料库进行研究,其目的是为了汉语的自动分析.统计结果表明,即使语料标注经过
目前计算机已经成为我们工作、学习、娱乐的必备工具,而输入法是我们使用计算机所必须要接触的部分.如果输入法设计得当,那么必将提高计算机的使用效率和人机交互的友好性.本
词表对于中文信息处理等领域具有重要的价值和意义.作者对从2002年10种主流报纸中提取的两个词表(流通度表和使用度表)前3000词语进行了比较,如果把使用度词表作为初表,对比
会议
基本词汇是词汇的核心,是汉语教学、语言本体研究及信息处理领域的基础.当前对基本词汇的研究还远远不够,还没有一个现实存在的基本词汇集,更没有对其量化测定的手段,本文介
交集型歧义是中文分词的一大难题,建立大规模高频最大交集型歧义字段(MOAS)的数据库,对于掌握其分布状况和自动消歧都具有重要意义.本文采用全切分方法,在4亿字人民日报语料
会议
统计方法在自然语言处理的多种应用中取得了令人瞩目的成果,但数据稀疏问题限制了应用系统性能的提高.把统计单位由词提升到词类有助于缓解数据稀疏问题,但是传统的词类体系
会议
本文根据现有对齐算法,提出了二次对齐思想,并重新修改了句子对齐评分规律,更好的把基于长度和基于词典的算法结合起来,同时优化了一些辅助算法,使计算效率和实用效果都达到
面向限定领域的特定任务翻译服务,在有限资源的掌上电脑(PersonalDigitalAssistant,PDA)上实现快速语音翻译这一实际问题,本文提出了一种基于suffixarrays数据结构的快速翻译
会议
译文生成是任何机器翻译系统所要解决的重要问题之一,也是机器翻译的最终目的.从本质上来讲,不管采用何种翻译方法,译文生成都要完成两个任务:一是源语与目标语之间的句法结
会议