基于概念匹配度模型的文献检索系统

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:ye77hao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在传统的手工文献检索中,科技文献的标引和检索都是人工完成的。随着电子文献的增多,手工处理文献已经显得力不从心,为了对大量的文献进行自动处理,从文献的标引到检索都要用计算机进行处理,从而大大增加了文献处理的数量和速度。信息检索系统经过几十年的发展,取得了长足进展,从基于简单好用的布尔模型的检索系统,到基于向量空间模型、概率模型的检索系统,使信息检索的精度不断提高,但是不同的检索系统对不同的文献会显示出不同的性能。为了提高文献信息检索系统的针对性,对现有检索系统进行改进以适应中文科技文献,是很实用和必要的。如何完善网页文档的表示方法使之更加准确的表示网页的实际内容;如何改进网页文档与用户查询的匹配方法,使得文献检索返回的网页更加符合用户的要求这些都关系到了文献检索的精确率的提高。本文采用了概念格理论从概念的角度去分析网页文档的表示问题,将查询与返回的文档都映射到本体后,我们再由它们共同构成的形式背景构造出概念格,在概念格上就可以找到用户提出的问题的相应的概念节点,用概念匹配度就可以计算出任意其它概念节点与问题概念节点之间的匹配度。最后按照与概念节点的匹配度排序,从而可以找到最满足用户查询的答案。这就是本文第3章提出的基于概念匹配度模型的文献检索系统。同时考虑到为整个待查询数据库建立一个单一的大概念格,所花费时间及格之间移动开销非常大等问题。第4章中给出了一种文档的新的表示形式,从而提出了一种新的网页文档与用户查询的匹配策略——基于概念格匹配度模型的文献检索系统,提高了文献检索的查询质量。通过实例证明,改进后的匹配模型更符合人脑的思维方式,符合人们对概念的理解,具有可行性。
其他文献
本文介绍了距离正则图有关问题的进展.  在一个直径为D的图中,若存在常数ci,bi(0≤i≤D),使得对图中任意距离为i的顶点x,y,在顶点y的邻点中,到顶点x距离为i-1的顶点数目为ci,到顶
爆破分析是偏微分方程和几何分析研究中的一个重要工具,在研究方程解的存在性,解序列的紧性及其相关性质上都有重要应用.本文主要研究几类偏微分方程的爆破分析,涉及到对应于各
学位
本文中,对于含单瞬时态的生灭过程,设其转移函数为pij(t),我们利用Ray-Knight方法以及Markov过程的游程理论,证明了pij(t)的强遍历性,并且得到了pij(t)的最大指数收敛速度的下界估
加密是保护信息安全的一种直接而有效的重要手段,同时也是信息隐藏应用中不可或缺的一项重要的预处理技术。与文本信息不同,图像等多媒体数据具有数据量大、存在内在联系等一
学位
随着网络技术和多媒体处理技术的发展,在线数据库、付费有线电视、CD/DVD版权的管理与分发和卫星电视等多媒体业务有着越来越广泛的应用,大量数字内容需要通过网络进行传输,