基于语义距离的跨语言信息检索研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:yyandmwm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
国内外在跨语言信息检索方面已经做了大量研究,但普遍是基于DQT的方法,工作重点一般放在翻译模块的改进上,这种模型虽然实现简单,但存在着不易选择正确译文、逐词翻译不够准确、词组翻译难度大等难以解决的问题。虽然也有研究试图解决这些问题,但进展有限。 本文提出了一种基于语义距离(语义相似度)计算的跨语言信息检索新模型,打破了常规的基于字符串匹配的信息检索模式,实现了语义层的信息检索,在一定程度上解决了传统跨语言检索系统面临的难题,并具有网页排序算法简单等优点。 在语义距离的计算方面,我们用到了著名的中英文知识库——知网(Hownet),利用它提供的丰富的语义信息,把文档间语义距离的计算依次分解为关键词间语义距离计算、义原间的语义距离计算,实践证明取得了良好的效果。
其他文献
确保大学生的安全与稳定,不仅关系到高校的自身建设与发展,而且关系到国家的长治久安。立足于大学生安全稳定工作,必须坚持着眼长远和把握全局的思想方法,搞好总结分析和实践
2014年春秋季对台湾以东黑潮主流径区碳化学的研究表明,春季黑潮主流径水体垂向可划分为黑潮表层水(KSW)、热带水(KTW)、中层水(KIW)和深层水(KDW),水层以30~50m、300~400m和
在计算机技术飞速发展的今天,CAD技术已越来越多的应用于工程设计领域.虽然目前国内组合式中央空调机组的设计软件并不罕见,但多局限于建筑布图设计,在AutoCAD环境下,实现空
阅读理解与阅读者的语言知识、言语技能、知识面、阅读经验、生活体验有关.此外,阅读材料的有关背景知识、体裁、难易程度、风格等也影响着阅读理解.因此, 阅读理解测试的信
学位
本论文介绍了LAS-2000+系统物理层软件的设计方案,并着重讨论其中小区选择/重选过程和SIM卡读写接口的设计与实现。论文首先介绍LAS-2000+系统的软硬件体系结构,描述了物理层软
流动人口由于其自身社会资本的匮乏,其子女,也就是所谓的"二代移民"在接受教育中存在着"隐性"不公平。通过社会调查研究统计,探究流动人口自身拥有的社会资本与其子女的受教育机
P2P系统提供了一个优秀的资源共享平台,当平台上的资源越来越多,就需要信息检索技术的介入,从而有效的定位到用户感兴趣的文档。然而P2P下应用信息检索技术面临两个问题:同义词和
(一) 1986年9月举行的中共十二届六中全会,通过了《中共中央关于社会主义精神文明建设指导方针的决议》。决议指出:“社会主义精神文明建设的根本任务,是适应社会主义现代化
随着金融行业的迅猛发展,金融产品的网络知识服务平台越来越得到众多投资者的认可。以债券为例,网络中大量债券异构信息的存在,为构建自动化的债券知识服务平台提供了一定的数据