基于二部图最大匹配的汉日词对齐

来源 :第九届全国计算语言学学术会议 | 被引量 : 0次 | 上传用户:wwwzjs19890622
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文提出了基于二部图的词对齐模型:利用二部图为双语句对建模,利用词形、语义、词性和共现等信息计算单词间的相似度,利用加权二部图最大匹配获得最终对齐结果。实验表明,该方法在一定程度上解决了当前很多词对齐方法存在的未登录词问题、灵活翻译问题和全局最优匹配问题等不足。
其他文献
本文以感知词语为实例,尝试以汉语框架语义知识库(CFN)现有的构建结果为基础资源,以短语类型、句法功能以及词语本身的句法语义属性为已知条件,初步归纳汉语句子中语义角色的
本研究以新鲜和冷冻的水稻幼苗叶片为材料,探索水稻叶片直接作为模板进行PCR扩增的方法.结果表明,与对照SDS法提取的DNA相比,应用新鲜或冷冻的1~2 mm2水稻叶片直接作为模板在
框架网络是二十世纪末菲尔摩(J. C. Fillmore)在框架语义学的基础上提出并主持的研究项目。该项目的目的在于建立用于自然语言处理的词汇知识库,并根据词汇知识资源研究英语
针对现有串并联变换型UPS在市电停电时存在效率不高以及开关损耗大等问题,提出一种新型UPS系统模型。分析表明,该UPS电源系统在电网停电逆变模式下两个变流器同时协调工作,整
本文主要介绍了中文阅读理解语料库的构建过程,重点介绍了语义标注的过程,内容包括对文章的筛选、问句的设计、指称指代标注、框架语义标注、以及语料库评测标准等相关工作的
HNC团队在建立词语知识库的过程中.逐步建立起以句类体系为指导的现代汉语句库。HNC句库为动词配备了丰富而真实的例句,充分展现了动词的意义和用法。本文介绍了HNC句库的基
本文在提出标点句的基础之上,讨论了标点句的研究内容及意义,重点论述了标点句的标注问题。基于易视性、自动形成树形结构、便于扩充三原则,我们提出一种用于标点句研究的不
汉语篇章修辞结构标注项目CJPL依据修辞结构理论(RhetoricalStructure Theory, RST),定义了汉语篇章修辞分析的基本单元和修辞关系集,草拟了篇章结构标注工作守则、标注工作
在统计机器翻译系统的解码过程中,经常会出现训练语料中没有的"未登录词",这些词的出现严重地影响了解码器的速度和整个系统的性能,为此,本文通过对未登录词现象及其同义词的
双语语料库在机器翻译研究中是非常重要的。本文探讨了如何利用蒙英双语语料进行蒙英翻译片段对的抽取,在蒙英两种语料进行词性标注处理之后,利用假设-检验的方法通过词语关