【摘 要】
:
基于实例的机器翻译(EBMT)是一种高效的机器翻译方法,如何快速地从海量实例模式库中找出与待翻译句子相似的候选实例,是EBMT研究的关键技术之一.统计分析维吾尔语单词字母的
论文部分内容阅读
基于实例的机器翻译(EBMT)是一种高效的机器翻译方法,如何快速地从海量实例模式库中找出与待翻译句子相似的候选实例,是EBMT研究的关键技术之一.统计分析维吾尔语单词字母的分布特征,构造了基于维吾尔语单词的倒排索引散列表,在等概率条件下,平均查找长度为1.59;依据散列冲突的同义词在维吾尔语料中出现的频率作为权值.提出了一种新颖的解决散列冲突的算法:同义词次优树算法.实验显示,算法的性能比传统的顺序查找和二分查找算法分别高出了27.5%,21.8%,证明了该算法在EBMT中有较高的检索效率.
其他文献
In this paper, we studied the dual form of the basic line algorithm for linearprograms. It can be easily implemented in a tableau that similar to the primal/dua
我国沥青混合料桥面铺装早期破坏严重,防水粘结层破坏是导致桥面铺装病害的一个主要原因,而且至今仍然缺乏有效的措施。解决层间胶结材料质量薄弱问题,是桥面铺装耐久性的重
Extraction equilibrium features of succinic acid, malic acid, maleic acid and fumaric acid were investigated systematically with trioctylamine (TOA) in chlorofo
庞西垌—金山银金矿床位于广东廉江县与广西博白县的交界 ,是一个以银为主 ,含有金、铅、锌等伴生有益组分的银多金属矿床。研究表明 ,前寒武系—寒武系变质岩系是银金矿床的
Objective: to report the application of GPIIb/IIIa antagonist (Integrilin) in peri-percutaneous transluminal catheter angioplasty and stent implantation in Chin
镰刀龙类化石主要分布于亚洲白垩纪地层(Russell and Dong,1993;Xu et al.,1999a;Kirkland and Wolfe,2001).最近发现于内蒙古上白垩统二连组的杨氏内蒙古龙(Neimongosaurus
针对轮南地区奥陶系裂缝型储层埋藏深、构造形成期多、影响因素多、后期改造作用复杂等特点 ,采用数理统计、应力场数值模拟、岩石力学性质与构造、沉积、钻井资料相结合分析
Seven Chinese coals ranking from anthracite to sub-bituminous from the Shanxi province were selected for study to forecast the combustion and NOx emission behav
从蒙脱石的结构分析出发,研究了其提纯工艺路线.首先将钙基膨润土(经水浸泡)钠化处理,将层状堆积的结构打开(由于蒙脱石的表面带负电,端面带正电),在水分散介质中,蒙脱石颗粒
以安钢1780卷取区步进梁的调试为例,分析研究了调试过程中步进梁的步距控制、速度控制、液压缸保压、步进梁多段同步和一个极端情况等几个问题,提出了一个关于接近传感器设置