汉英机器翻译扩充词典的建造

来源 :2002年全国机器翻译研讨会 | 被引量 : 0次 | 上传用户:tc2020
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文首先介绍了我们在"面向新闻领域的汉英机器翻译系统"中语言资源建设的总体框架,然后着重介绍了其中扩充词典的建设方法.扩充词典是相对于核心词典而言的,特点是词汇量大,每个词的信息相对较少.扩充词典的建设包括以下几个阶段:收集;格式整理;词条拆分;词性标记归一化;词性标记补齐;词条合并.实验结果表明,采用这种方法,利用较少的人工,就可以得到规模很大、并初步可用的双语机器翻译词典,并且这部词典可大大减少翻译中未定义词的数量,提高翻译的质量.
其他文献
1常见诱因训练性晕厥是由于脑血流量暂时降低,或血液中化学物质变化所致的短暂意识紊乱或意识丧失。队列训练中出现晕厥的主要原因:(1)血管减压性晕厥,也称单纯性晕厥。是由
低温共烧技术是现代微波器件,RF电路及其他高频电路的重要选择方案之一,它的低介电常数满足了封装对高频、高速化的要求.而3维封装是国际上近几年正在迅速发展着的电子封装技
会议
规范码是经原国家教委鉴定并通过的国家"八五"课题《全国中小学教学用汉字编码规范和计算机汉字输入系统》的科研成果.规范码由音码、形码和数码组成,具有科学、规范、易学、
会议
本文系统地介绍了数字统一码汉字输入法.将汉字的基本笔画赋予顺序值和位置关系值,以笔画的顺序值与关系值作为汉字编码依据.数字统一码码元"1"~"9",码长1~6码,编码字符包括I
本文从电脑和网络发展的角度,来讨论键盘汉字输入法需求的变化.并从汉字键盘输入服务大众及服务教学的角度,探讨了对汉字键盘输入的要求.文章介绍了笔者开发的《汉字工具箱》
会议
"易学"与"重码"是一对矛盾.人们是根据社会发展各个时期的不同要求,来决定如何解决这一矛盾.随着计算机、手机等设备的普及,输入法的"易学性"已是人们首要关心的问题:与此同
会议
迄今为止,统一的输入法只有汉语拼音输入法,它得益于字母化的《汉语拼音方案》,线性组合的拼音字母,可对应字母键盘实现"无编码"输入.同理,统一字形输入法的基础是统一汉字的
机器翻译使用的形式语法既要能排除自然语言的歧义,又要能覆盖特定自然语言的全部现象.这种情况一直困扰着机器翻译的研究与开发.迄今为止,国际上还没有十分完满的解决办法.
由于开发英汉机器辅助翻译系统的需要,我们调查了许多用户;调查结果发现,用户需要系统提供对英文原文的语言辅助分析支持,尤其是英文长句子的句法分析支持和英文词汇包括对生
本文介绍作者对于一个英汉机器翻译系统消歧功能测试的结果.测试工作分词汇歧义测试和结构歧义测试两个方面.首先选择有代表性的例句用这个机器翻译系统进行全自动的翻译,然