基于语义距离的跨语言信息检索研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:yyandmwm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
国内外在跨语言信息检索方面已经做了大量研究,但普遍是基于DQT的方法,工作重点一般放在翻译模块的改进上,这种模型虽然实现简单,但存在着不易选择正确译文、逐词翻译不够准确、词组翻译难度大等难以解决的问题。虽然也有研究试图解决这些问题,但进展有限。 本文提出了一种基于语义距离(语义相似度)计算的跨语言信息检索新模型,打破了常规的基于字符串匹配的信息检索模式,实现了语义层的信息检索,在一定程度上解决了传统跨语言检索系统面临的难题,并具有网页排序算法简单等优点。 在语义距离的计算方面,我们用到了著名的中英文知识库——知网(Hownet),利用它提供的丰富的语义信息,把文档间语义距离的计算依次分解为关键词间语义距离计算、义原间的语义距离计算,实践证明取得了良好的效果。
其他文献
确保大学生的安全与稳定,不仅关系到高校的自身建设与发展,而且关系到国家的长治久安。立足于大学生安全稳定工作,必须坚持着眼长远和把握全局的思想方法,搞好总结分析和实践
在计算机技术飞速发展的今天,CAD技术已越来越多的应用于工程设计领域.虽然目前国内组合式中央空调机组的设计软件并不罕见,但多局限于建筑布图设计,在AutoCAD环境下,实现空
本论文介绍了LAS-2000+系统物理层软件的设计方案,并着重讨论其中小区选择/重选过程和SIM卡读写接口的设计与实现。论文首先介绍LAS-2000+系统的软硬件体系结构,描述了物理层软
P2P系统提供了一个优秀的资源共享平台,当平台上的资源越来越多,就需要信息检索技术的介入,从而有效的定位到用户感兴趣的文档。然而P2P下应用信息检索技术面临两个问题:同义词和
随着金融行业的迅猛发展,金融产品的网络知识服务平台越来越得到众多投资者的认可。以债券为例,网络中大量债券异构信息的存在,为构建自动化的债券知识服务平台提供了一定的数据