基于强制对齐的层次短语模型过滤和优化

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:q158743153
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文提出一种层次短语模型过滤和优化方法.该方法在采用传统方法训练得到层次短语规则的基础上,通过强制对齐同时构建源语言和目标语言的解析树,从中过滤并抽取对齐的层次短语规则,最后利用这些规则重新估计翻译模型的翻译概率.该方法不需要引入任何语言学知识,适合大规模语料训练模型.在大规模中英翻译评测任务中,采用该方法训练的模型与传统层次短语模型相比,不仅能够过滤50%左右规则,同时获得0.8~1.2BLEU值的提高.
其他文献
服装是人类生活必不可少的实用品与艺术品要素,服装在其基本构成的造型、色彩、材料三个因素上均具有审美意义。尤其是材料中的面料,它是构成服装一切审美意义的载体,它的风格对
西宁李氏家族是河湟地区的一大望族,有叨一代,李氏家族涌现出多位声名显赫的人物。依据新近查阅到的《李公同室太夫人郭氏墓表》,结合现有的李氏碑铭资料,以及《明实录》、《
目的分析2种DNA提取方法对人乳头状瘤病毒(HPV)分型杂交结果的影响,为进一步提高临床检验质量和改进检测技术提供理论依据。方法收集326例宫颈脱落细胞标本,分别采用磁珠法和
通过对北京市2000~2004年间大气污染物排放情况的考察和研究,着重分析了二氧化硫等大气污染物的排放现状以及大气污染物排放强度指标变化的原因并与国内主要城市及美国大气污
随着世界各国环保意识的逐步增强,国际市场上有关纺织品贸易的壁垒措施出现了新的动向。各种技术壁垒措施愈演愈烈,其中以打着“环境保护”旗帜,行“贸易保护”之实的“绿色
本文对北京市167对匹配母亲静脉血与脐带血中15种全氟化合物前体物质浓度水平与胎盘透过率进行了分析.研究结果表明,6∶2氟调聚磺酸(6∶2 FTS),N-甲基全氟辛基磺酰胺乙酸(NMe
整理汇总了成都市中心城区及郊县餐厨垃圾产生和收运现状,对其产量作出预测;在此基础上提出适合成都市自身情况的餐厨垃圾监管体系构建设想。
海南州藏族教育历史与现状调查何波,刘旭东一自然环境与人文条件海南藏族自治州位于青海湖之南,青藏高原东北隅,总面积为4.6万平方公里,平均海拔3245米。地形以高原山地为主,境内共和盆地
<正> 朱解琳同志编著的《藏族近现代教育史略》(以下简称《史略》)一书,1990年已由青海人民出版社出版发行,引起了从事藏族教育和藏学研究同志们的普遍关注。这是一部专门论
<正>之一繁华的大上海,车水马龙的长宁区,有一所特殊的职业学校——长宁区初级职业技术学校(以下简称"长宁初职")。这是一所有底蕴、有积淀的学校。1926年,被称为"传科技之火