论文部分内容阅读
在传统的手工文献检索中,科技文献的标引和检索都是人工完成的。随着电子文献的增多,手工处理文献已经显得力不从心,为了对大量的文献进行自动处理,从文献的标引到检索都要用计算机进行处理,从而大大增加了文献处理的数量和速度。信息检索系统经过几十年的发展,取得了长足进展,从基于简单好用的布尔模型的检索系统,到基于向量空间模型、概率模型的检索系统,使信息检索的精度不断提高,但是不同的检索系统对不同的文献会显示出不同的性能。为了提高文献信息检索系统的针对性,对现有检索系统进行改进以适应中文科技文献,是很实用和必要的。如何完善网页文档的表示方法使之更加准确的表示网页的实际内容;如何改进网页文档与用户查询的匹配方法,使得文献检索返回的网页更加符合用户的要求这些都关系到了文献检索的精确率的提高。本文采用了概念格理论从概念的角度去分析网页文档的表示问题,将查询与返回的文档都映射到本体后,我们再由它们共同构成的形式背景构造出概念格,在概念格上就可以找到用户提出的问题的相应的概念节点,用概念匹配度就可以计算出任意其它概念节点与问题概念节点之间的匹配度。最后按照与概念节点的匹配度排序,从而可以找到最满足用户查询的答案。这就是本文第3章提出的基于概念匹配度模型的文献检索系统。同时考虑到为整个待查询数据库建立一个单一的大概念格,所花费时间及格之间移动开销非常大等问题。第4章中给出了一种文档的新的表示形式,从而提出了一种新的网页文档与用户查询的匹配策略——基于概念格匹配度模型的文献检索系统,提高了文献检索的查询质量。通过实例证明,改进后的匹配模型更符合人脑的思维方式,符合人们对概念的理解,具有可行性。