论文部分内容阅读
随着计算机技术和网络技术的迅速发展,信息检索技术也有了很大发展。信息检索(IR)按信息表达形式的不同,可分为文本检索、多媒体信息(如图片、音像)检索等方面。其中,文本检索是最重要、最普遍的。但是,无论是基于关键词还是基于概念的文本检索,均以词匹配模式为核心。使用一个个孤立的关键词或概念标识检索或标识文本,无疑割裂了原始文本的逻辑语义。由于自然语言表达的复杂性,词匹配的这种自身缺陷可能是限制其检索效率进一步提高的重要原因。
医学是信息密集程度最高的学科之一。目前医学界,使用最频繁的外文数据库是MEDLINE,它是NLM开发的基于MeSH词表的文摘型数据库,它所提供的检索方式主要是主题词检索和自由文本词检索,都以词匹配模式为核心。为改善检索效率,本文在深入分析UMLS超级叙词表和语义网络的基础上,借鉴国内外语义网络研究成果,结合实际检索工作,以Powerbuilder8.0和SQLServer2000为工具,建立了基于UMLS的语义检索实验系统,并对主题词检索和语义检索和自由文本词检索这三种检索方式的检索效率进行比较分析,结果表明:语义检索的检索效率明显高于另外两种检索方式。