一种有效的基于Web的双语翻译对获取方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:zm_free
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
命名实体和新词、术语的翻译对机器翻译、跨语言检索、自动问答等系统的性能有着重要的影响,但是这些翻译很难从现有的翻译词典中获得。该文提出了一种从中文网页中自动获取高质量双语翻译对的方法。该方法利用网页中双语翻译对的特点,使用统计判别模型,融合多种识别特征自动挖掘网站中存在的双语翻译对。实验结果表明,采用该模型构建的双语翻译词表,TOP1的正确率达到82.1%,TOP3的正确率达到94.5%。文中还提出了一种利用搜索引擎验证候选翻译的方法,经过验证,TOP1的正确率可以提高到84.3%。
其他文献
世界上没有一种绝对完美的医疗模式,各国国情不同,适合的医疗模式也各不相同。  美国:市场法则主导  目前,美国有70%的人口接受私人或保险公司的医疗保险;10%是65岁以上的老年人,由国家提供医疗保险;10%贫穷人口由国家提供医疗费用;10%的人口没有任何医疗保护措施。美国这种以自由医疗保险为主、按市场法则经营的以盈利为目的的制度,优点是受保人会获得高质量、有效率的医疗服务。但这种制度往往拒绝接受
在相同的制备条件下,采用相同SiO_2浓度、不同粒径的硅溶胶作为硅源制备费托合成沉淀铁Fe/Cu/K/SiO_2催化剂,考察了硅溶胶粒径对沉淀铁催化剂费托合成反应性能的影响。实验结
基于统计的词义消歧模型的一个关键问题是如何自动从语料库中获取指示词,虽然通过学习初始搭配实例能够在语料库中获取更多的搭配知识,但人工获取质量较好的初始搭配是比较困
在连续流动固定床反应器上,研究了Cu/SiO2催化丙二酸二乙酯(DEM)加氢制备1,3-丙二醇(1,3-PDO)的反应。采用H2-TPR、XRD、SEM、N2吸附-脱附等方法对催化剂进行表征。进一步优化了原料