切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
会议论文
基于二部图最大匹配的汉日词对齐
基于二部图最大匹配的汉日词对齐
来源 :第九届全国计算语言学学术会议 | 被引量 : 0次 | 上传用户:wwwzjs19890622
【摘 要】
:
该文提出了基于二部图的词对齐模型:利用二部图为双语句对建模,利用词形、语义、词性和共现等信息计算单词间的相似度,利用加权二部图最大匹配获得最终对齐结果。实验表明,该
【作 者】
:
吴宏林
刘绍明
【机 构】
:
东北大学信息学院软件与理论研究所自然语言处理实验室 沈阳 110004
【出 处】
:
第九届全国计算语言学学术会议
【发表日期】
:
2007年期
【关键词】
:
二部图
最大匹配
词对齐
信息计算
未登录词
全局最优
匹配问题
方法
翻译问题
对齐模型
相似度
语义
双语
实验
建模
加权
单词
词性
词形
程度
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文提出了基于二部图的词对齐模型:利用二部图为双语句对建模,利用词形、语义、词性和共现等信息计算单词间的相似度,利用加权二部图最大匹配获得最终对齐结果。实验表明,该方法在一定程度上解决了当前很多词对齐方法存在的未登录词问题、灵活翻译问题和全局最优匹配问题等不足。
其他文献
汉语感知词语的语义角色标注规则初探
本文以感知词语为实例,尝试以汉语框架语义知识库(CFN)现有的构建结果为基础资源,以短语类型、句法功能以及词语本身的句法语义属性为已知条件,初步归纳汉语句子中语义角色的
会议
汉语句子
感知
词语
语义角色
句法语义属性
词汇语义特征
语义知识库
句法功能
角色识别
基础资源
标注规则
小规模
数据
框架
构建
短语
测试
应用水稻叶片直接PCR扩增的方法
本研究以新鲜和冷冻的水稻幼苗叶片为材料,探索水稻叶片直接作为模板进行PCR扩增的方法.结果表明,与对照SDS法提取的DNA相比,应用新鲜或冷冻的1~2 mm2水稻叶片直接作为模板在
期刊
Rice
PCR
Rice leaves
Direct-PCR amplification
DNA
框架网络的理解和构建
框架网络是二十世纪末菲尔摩(J. C. Fillmore)在框架语义学的基础上提出并主持的研究项目。该项目的目的在于建立用于自然语言处理的词汇知识库,并根据词汇知识资源研究英语
会议
框架语义学
网络
词汇知识
自然语言处理
二十世纪末
资源研究
语义研究
语义结构
语法功能
技术细节
构建过程
知识库
菲尔摩
英语
描述
基础
新型双变流器UPS系统的效率分析
针对现有串并联变换型UPS在市电停电时存在效率不高以及开关损耗大等问题,提出一种新型UPS系统模型。分析表明,该UPS电源系统在电网停电逆变模式下两个变流器同时协调工作,整
期刊
双变流器
UPS系统
效率分析
在线式
弦波
补偿式
次谐波
功率开关
输入功率因数
开关损耗
基于语义标注的中文阅读理解语料库的建设
本文主要介绍了中文阅读理解语料库的构建过程,重点介绍了语义标注的过程,内容包括对文章的筛选、问句的设计、指称指代标注、框架语义标注、以及语料库评测标准等相关工作的
会议
语义标注
中文
阅读理解
语料库
相关工作
评测标准
构建过程
设计
筛选
描述
框架
以HNC句类体系为指导的现代汉语句库建设
HNC团队在建立词语知识库的过程中.逐步建立起以句类体系为指导的现代汉语句库。HNC句库为动词配备了丰富而真实的例句,充分展现了动词的意义和用法。本文介绍了HNC句库的基
会议
句类
体系
汉语
意义和用法
应用前景
简要说明
动词
知识库
团队
配备
例句
规范
词语
标点句标注研究
本文在提出标点句的基础之上,讨论了标点句的研究内容及意义,重点论述了标点句的标注问题。基于易视性、自动形成树形结构、便于扩充三原则,我们提出一种用于标点句研究的不
会议
标点
新方法
统计分析
树形结构
证明
扩充
句法
基础
汉语财经评论的修辞结构标注研究
汉语篇章修辞结构标注项目CJPL依据修辞结构理论(RhetoricalStructure Theory, RST),定义了汉语篇章修辞分析的基本单元和修辞关系集,草拟了篇章结构标注工作守则、标注工作
会议
汉语
财经
修辞结构理论
中文信息处理
形式化方法
修辞关系
修辞分析
数据
篇章结构
篇章分析
基本单元
工作流程
工作目
用法
移用
论文
基础
标记
汉英统计翻译系统中未登录词的处理方法
在统计机器翻译系统的解码过程中,经常会出现训练语料中没有的"未登录词",这些词的出现严重地影响了解码器的速度和整个系统的性能,为此,本文通过对未登录词现象及其同义词的
会议
汉英
统计
机器翻译系统
未登录词
训练语料
汉语同义词
语义知识
解码过程
处理方法
词义消歧
源语言
解码器
性能
实验
能力
解释
程度
蒙英翻译片段对的自动抽取
双语语料库在机器翻译研究中是非常重要的。本文探讨了如何利用蒙英双语语料进行蒙英翻译片段对的抽取,在蒙英两种语料进行词性标注处理之后,利用假设-检验的方法通过词语关
会议
翻译研究
双语语料库
自动抽取
词性标注
关联度
计算
机器
方法
词语
处理
与本文相关的学术论文